CN115827878B - 语句情感分析方法、装置以及设备 - Google Patents

语句情感分析方法、装置以及设备 Download PDF

Info

Publication number
CN115827878B
CN115827878B CN202310100512.4A CN202310100512A CN115827878B CN 115827878 B CN115827878 B CN 115827878B CN 202310100512 A CN202310100512 A CN 202310100512A CN 115827878 B CN115827878 B CN 115827878B
Authority
CN
China
Prior art keywords
training
feature
emotion
sentence
syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310100512.4A
Other languages
English (en)
Other versions
CN115827878A (zh
Inventor
蔡倩华
陈洁海
刘俊希
薛云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202310100512.4A priority Critical patent/CN115827878B/zh
Publication of CN115827878A publication Critical patent/CN115827878A/zh
Application granted granted Critical
Publication of CN115827878B publication Critical patent/CN115827878B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本发明涉及情感分析领域,特别涉及一种语句情感分析方法、装置、设备以及存储介质,获得训练语句的句法信息以及语义信息,采用匿名游走方法,对训练语句的句法结构信息进行提取,并将提取到的句法结构信息、训练语句的句法信息以及语义信息作为训练数据对模型进行训练,增强了模型句法依赖解析能力,提高了模型对句法结构分析的准确性,能够更加全面地对语句进行情感分析,提高情感分析的精准性以及效率。

Description

语句情感分析方法、装置以及设备
技术领域
本发明涉及情感分析领域,特别涉及一种语句情感分析方法、装置、设备以及存储介质。
背景技术
方面级情感分类是情感分析邻域中一个细粒度的任务,其目的在于识别一个句子中给定方面词的情感极性,其中情感极性包括了积极,消极和中性。近年来,基于句法依赖树的图神经网络在方面级情感分类上被广泛应用。图卷积网络和图注意力网络均是通过依存树上的节点连接关系来聚合相邻节点特征,从而引入句法信息和学习节点的特征表示。
然而,目前的技术方案仍然存在以下问题。首先,由句法解析器生成的依存树不是针对方面词,这意味着方面词与观点词的联系并不紧密。当句子中的方面词和观点词在句法依存树没有连接关系时,图神经网络并不能建模方面词和观点的关系,进而导致模型无法正确判断方面词的情感极性。此外,有研究指出大多数图神经网络仅通过图上的连接关系来聚合节点的特征信息,而这种图神经网络主要关注于节点特征,忽略了同样可以作为节点属性的结构模式信息,从而削弱了节点嵌入的表示能力,进而影响图神经网络在分类任务上的性能表现。导致了对句法依赖解析不准确,对句子本身句法结构分析得不完整,从而难以对语句进行全面的情感分析,降低了情感分析的准确性。
发明内容
基于此,本发明提供一种语句情感分析方法、装置、设备以及存储介质,获得训练语句的句法信息以及语义信息,采用匿名游走方法,对训练语句的句法结构信息进行提取,并将提取到的句法结构信息、训练语句的句法信息以及语义信息作为训练数据对模型进行训练,增强了模型句法依赖解析能力,提高了模型对句法结构分析的准确性,能够更加全面地对语句进行情感分析,提高情感分析的精准性以及效率。
该技术方法如下:
第一方面,本申请实施例提供了一种语句情感分析方法,包括以下步骤:
获取预设批次的训练语句集以及情感标签集,其中,所述训练语句集中包括若干个训练语句,所述情感标签集包括若干个训练语句的真实情感向量以及真实情感极性;
获取待训练的情感分析模型,其中,所述待训练的情感分析模型包括句子编码模块、语义图卷积模块、句法图卷积模块、特征交互模块以及情感分析模块;
将所述训练语句集输入至所述句子编码模块中,获取若干个所述训练语句的句子特征表示;
将若干个所述训练语句的句子特征表示输入至所述语义图卷积模块中,获得若干个所述训练语句的语义特征表示;
构建若干个所述训练语句的依存句法图,根据若干个所述训练语句的初始句法图,构建若干个所述训练语句的第一句法邻接矩阵,将所述句子特征表示以及第一句法邻接矩阵输入至所述句法图卷积模块中,获得若干个所述训练语句的句法特征表示;
将若干个所述训练语句的语义特征表示以及句法特征表示输入至所述特征交互模块中进行特征交互,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量;
将同一个训练语句的方面词对应的句法交互特征向量以及语义交互特征向量进行拼接,获得若干个所述训练语句的拼接特征向量,将若干个所述训练语句的拼接特征向量输入至所述情感分析模块中进行情感分析,获取若干个所述训练语句的预测情感向量以及预测情感极性;
采用匿名游走方法,对若干个所述训练语句的依存句法图进行句法结构信息提取,获取若干个所述训练语句的句法结构特征数据;
根据若干个所述训练语句的预测情感向量、预测情感极性、真实情感向量、真实情感极性、句法交互特征表示以及语义交互特征表示以及句法结构特征数据以及预设的损失函数,对所述待训练的情感分析模型进行训练,获得目标情感分析模型;
获取待测语句,将所述待测语句输入至所述目标情感分析模型中,获得所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
第二方面,本申请实施例提供了一种基于句法结构增强的语句情感分析装置,包括:
数据获取模块,用于获取预设批次的训练语句集以及情感标签集,其中,所述训练语句集中包括若干个训练语句,所述情感标签集包括若干个训练语句的真实情感向量以及真实情感极性;
模型获取模块,用于获取待训练的情感分析模型,其中,所述待训练的情感分析模型包括句子编码模块、语义图卷积模块、句法图卷积模块、特征交互模块以及情感分析模块;
句子编码模块,用于将将所述训练语句集输入至所述句子编码模块中,获取若干个所述训练语句的句子特征表示;
语义特征提取模块,用于将若干个所述训练语句的句子特征表示输入至所述语义图卷积模块中,获得若干个所述训练语句的语义特征表示;
句法特征提取模块,用于构建若干个所述训练语句的依存句法图,根据若干个所述训练语句的初始句法图,构建若干个所述训练语句的第一句法邻接矩阵,将所述句子特征表示以及第一句法邻接矩阵输入至所述句法图卷积模块中,获得若干个所述训练语句的句法特征表示;
特征交互模块,用于将若干个所述训练语句的语义特征表示以及句法特征表示输入至所述特征交互模块中进行特征交互,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量;
情感分析模块,用于将同一个训练语句的方面词对应的句法交互特征向量以及语义交互特征向量进行拼接,获得若干个所述训练语句的拼接特征向量,将若干个所述训练语句的拼接特征向量输入至所述情感分析模块中进行情感分析,获取若干个所述训练语句的预测情感向量以及预测情感极性;
句法结构特征提取模块,用于采用匿名游走方法,对若干个所述训练语句的依存句法图进行句法结构信息提取,获取若干个所述训练语句的句法结构特征数据;
模型训练模块,用于根据若干个所述训练语句的预测情感向量、预测情感极性、真实情感向量、真实情感极性、句法交互特征表示以及语义交互特征表示以及句法结构特征数据以及预设的损失函数,对所述待训练的情感分析模型进行训练,获得目标情感分析模型;
情感预测模块,用于获取待测语句,将所述待测语句输入至所述目标情感分析模型中,获得所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的语句情感分析方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的语句情感分析方法的步骤。
在本实施例中,提供一种语句情感分析方法、装置、设备以及存储介质,获得训练语句的句法信息以及语义信息,采用匿名游走方法,对训练语句的句法结构信息进行提取,并将提取到的句法结构信息、训练语句的句法信息以及语义信息作为训练数据对模型进行训练,增强了模型句法依赖解析能力,提高了模型对句法结构分析的准确性,能够更加全面地对语句进行情感分析,提高情感分析的精准性以及效率。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请一个实施例提供的语句情感分析方法的流程示意图;
图2为本申请一个实施例提供的语句情感分析方法中S4的流程示意图;
图3为本申请一个实施例提供的语句情感分析方法中S5的流程示意图;
图4为本申请一个实施例提供的语句情感分析方法中S6的流程示意图;
图5为本申请一个实施例提供的语句情感分析方法中S7的流程示意图;
图6为本申请一个实施例提供的语句情感分析方法中S8的流程示意图;
图7为本申请一个实施例提供的语句情感分析方法的中S9流程示意图;
图8为本申请一个实施例提供的基于句法结构增强的语句情感分析装置的结构示意图;
图9为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请一个实施例提供的语句情感分析方法的流程示意图,包括如下步骤:
S1:获取预设批次的训练语句集以及情感标签集,其中,所述训练语句集中包括若干个训练语句,所述情感标签集包括若干个训练语句的真实情感向量以及真实情感极性。
本申请的语句情感分析方法的执行主体为语句情感分析方法的分析设备(以下简称分析设备)。
在一个可选的实施例中,分析设备可以是一台计算机设备,可以是服务器,或多台计算机设备联合而成的服务器机群。
在本实施例中,分析设备获取预设批次的训练语句集以及情感标签集,其中,所述训练语句集中包括若干个训练语句,所述情感标签集包括若干个训练语句的真实情感向量以及真实情感极性。
具体地,分析设备可以获取用户输入的预设批次的训练语句集以及情感标签集,也可以从预设的数据库中,获取相应的批次的训练语句集以及情感标签集,其中,所述训练语句包括若干个单词,所述单词包括若干个上下文单词以及方面词,所述训练语句的句子表达式为:
Figure SMS_1
式中,s为所述训练语句的句子表示,
Figure SMS_2
为第n个单词对应的词表示,n为所述单词的数目,其中,训练语句中的方面词的表达式为:
Figure SMS_3
式中,
Figure SMS_4
为所述方面词的词表示,
Figure SMS_5
为所述方面词中的单词的在所述训练语句中的起始位置,
Figure SMS_6
为所述方面词中的单词在所述训练语句中的终止位置。
S2:获取待训练的情感分析模型。
在本实施例中,分析设备获取待训练的情感分析模型,其中,所述待训练的情感分析模型包括句子编码模块、语义图卷积模块、句法图卷积模块、特征交互模块以及情感分析模块。
S3:将所述训练语句集输入至所述句子编码模块中,获取若干个所述训练语句的句子特征表示。
所述句子特征表示包括若干个上下文单词的隐藏层向量。
所述句子编码模块采用BERT(BidirectionalEncoder Representation fromTransformers)词嵌入模型。
在本实施例中,分析设备将所述训练集中若干个训练语句输入至所述句子编码模块中进行编码处理,获得若干个所述训练语句的句子特征表示。具体地,分析设备将若干个所述训练语句分别输入至预设的BERT词嵌入模型中,将待测语句中的每个单词映射到低维向量空间中,经过查询预训练好的BERT矩阵,获得BERT词嵌入模型输出的若干个所述训练语句的若干个单词的隐藏层向量,并进行编码处理,获得若干个所述训练语句的句子特征表示,其中,所述句子特征表示为:
Figure SMS_7
式中,H为所述句子特征表示,
Figure SMS_8
为第n个单词的隐藏层向量。
S4:将若干个所述训练语句的句子特征表示输入至所述语义图卷积模块中,获得若干个所述训练语句的语义特征表示。
在本实施例中,分析设备将若干个所述训练语句的句子特征表示输入至所述语义图卷积模块中,获得若干个所述训练语句的语义特征表示。
所述语义图卷积模块包括第一多层图卷积神经网络,请参阅图2,图2为本申请一个实施例提供的语句情感分析方法中S4的流程示意图,包括步骤S41~S42,具体如下:
S41:根据若干个所述训练语句的句子特征表示以及预设的自注意力计算算法,构建若干个所述训练语句的语义邻接矩阵。
所述自注意力计算算法为:
Figure SMS_9
式中,
Figure SMS_10
为所述语义邻接矩阵,softmax为归一化函数,
Figure SMS_11
为所述句子特征表示,
Figure SMS_12
为所述语义图卷积模块的第一可训练权重参数,
Figure SMS_13
为所述语义图卷积模块的第二可训练权重参数,d为维度参数;
在本实施例中,分析设备根据若干个所述训练语句的句子特征表示以及预设的自注意力计算算法,构建若干个所述训练语句的语义邻接矩阵。
S42:分别将若干个所述训练语句的句子特征表示作为所述第一多层图卷积网络的首层输入数据,根据若干个所述训练语句的语义邻接矩阵以及预设的语义特征计算算法,获得若干个所述训练语句的语义特征表示。
所述语义特征计算算法为:
Figure SMS_14
式中,
Figure SMS_15
为所述第一多层图卷积网络的第l+1层的语义特征表示,
Figure SMS_16
为所述第一多层图卷积网络的第l层的语义特征表示,
Figure SMS_17
为非线性激活函数,
Figure SMS_18
为所述第一多层图卷积网络的第l层的可训练权重参数矩阵,
Figure SMS_19
为所述第一多层图卷积网络的第l层的偏差参数。
在本实施例中,分析设备分别将若干个所述训练语句的句子特征表示作为所述第一多层图卷积网络的首层输入数据,根据若干个所述训练语句的语义邻接矩阵以及预设的语义特征计算算法,获得所述所述第一多层图卷积网络的最后一层输出的语义特征表示,作为若干个所述训练语句的语义特征表示。
考虑到语句含有复杂的语义关系,通过引入自注意力机制,构造相应的语义邻接矩阵,利用第一多层图卷积网络聚合更新方面词节点,从而实现获得精准的若干个所述训练语句的语义特征表示。
S5:构建若干个所述训练语句的依存句法图,根据若干个所述训练语句的初始句法图,构建若干个所述训练语句的第一句法邻接矩阵,将所述句子特征表示以及第一句法邻接矩阵输入至所述句法图卷积模块中,获得若干个所述训练语句的句法特征表示。
在本实施例中,分析设备构建若干个所述训练语句的依存句法图,具体地,对于一个训练语句S,分析设备利用StanfordCoreNLP句法解析工具,得到原始句法依存树,其中,所述依存句法树包括若干个单词节点,将该训练语句的单词分别设置于单词节点上,该训练语句的依存句法图,其中,所述单词节点包括方面词节点,所述方面词节点上设置有该训练语句相应的方面词。
分析设备根据若干个所述训练语句的初始句法图,构建若干个所述训练语句的第一句法邻接矩阵,具体地,分析设备获取若干个所述训练语句的句法依赖信息,所述句法依赖信息用于指示所述待测语句中单词与单词之间的是否存在句法依赖关系,根据若干个所述训练语句的句法依赖信息,将若干个所述训练语句的依存句法图转化为相应的第一句法邻接矩阵,其中,所述第一句法邻接矩阵包括若干个单词节点之间的句法依赖数据,所述第一句法邻接矩阵的表达式为:
Figure SMS_20
式中,
Figure SMS_21
为第i个单词节点与第j个单词节点之间的句法依赖数据,
Figure SMS_22
表示第i个单词节点与第j个单词节点存在句法依赖关系。
通过赋予方面词节点和所有单词节点新的句法关系,以加强方面词与潜在观点词的联系,提高句法特征提取的准确性。
分析设备将所述句子特征表示以及第一句法邻接矩阵输入至所述句法图卷积模块中,获得若干个所述训练语句的句法特征表示。
所述句法图卷积模块包括第二多层图卷积网络,请参阅图3,图3为本申请一个实施例提供的语句情感分析方法中S5的流程示意图,包括步骤S51~S53,具体如下:
S51:将若干个所述训练语句的第一句法邻接矩阵中若干个单词之间的句法依赖数据转换为相应的句法依赖向量,根据预设的方面感知注意力算法,获得若干个所述训练语句的若干个单词之间的注意力系数。
所述方面感知注意力算法为:
Figure SMS_23
式中,ij为单词的索引参数,
Figure SMS_24
为第i个单词节点与第j个单词节点之间的注意力系数,
Figure SMS_25
为第i个单词节点与第j个单词节点之间的句法依赖向量,
Figure SMS_26
为预设的第一可训练权重参数矩阵,
Figure SMS_27
为预设的第二可训练权重参数矩阵,
Figure SMS_28
为预设的第一偏置参数,
Figure SMS_29
为预设的第二偏置参数,
Figure SMS_30
为单词节点数目。
在本实施例中,分析设备将若干个所述训练语句的第一句法邻接矩阵中若干个单词之间的句法依赖数据转换为相应的句法依赖向量,根据预设的方面感知注意力算法,获得若干个所述训练语句的若干个单词之间的注意力系数。
S52:根据若干个所述训练语句的方面词与若干个上下文单词之间的注意力系数,对若干个所述训练语句的第一句法邻接矩阵中相应的所述方面词与若干个上下文单词之间的句法依赖数据进行更新,获得若干个所述训练语句的第二句法邻接矩阵。
在本实施例中,分析设备根据若干个所述训练语句的方面词与若干个上下文单词之间的注意力系数,对若干个所述训练语句的第一句法邻接矩阵中相应的所述方面词与若干个上下文单词之间的句法依赖数据进行更新,获得若干个所述训练语句的第二句法邻接矩阵,具体如下:
Figure SMS_31
式中,
Figure SMS_32
为更新后的第i个单词节点与第j个单词节点之间的句法依赖数据。
S53:分别将若干个所述训练语句的句子特征表示作为所述第二多层图卷积网络的首层输入数据,根据若干个所述训练语句的第二句法邻接矩阵以及预设的句法特征计算算法,获得若干个所述训练语句的句法特征表示。
所述句法特征计算算法为:
Figure SMS_33
式中,
Figure SMS_34
为所述第二多层图卷积网络的第l+1层的句法特征表示,
Figure SMS_35
为所述第二多层图卷积网络的第l层的句法特征表示,
Figure SMS_36
为非线性激活函数,
Figure SMS_37
为所述第二句法邻接矩阵,
Figure SMS_38
为所述第二多层图卷积网络的第l层的可训练权重参数矩阵,
Figure SMS_39
为所述第二多层图卷积网络的第l层的偏差参数。
在本实施例中,分析设备分别将若干个所述训练语句的句子特征表示作为所述第二多层图卷积网络的首层输入数据,根据若干个所述训练语句的第二句法邻接矩阵以及预设的句法特征计算算法,获得所述第二多层图卷积网络的最后一层输出的句法特征表示,作为若干个所述训练语句的句法特征表示。
利用方面感知注意力机制,自适应地聚合句法树上方面词节点的邻居节点,降低了重构的句法树产生的噪声的影响,从而在图卷积网络中更新句子特征表示中若干个单词的隐藏层向量时,能够充分利用句法依赖关系信息,获取到更加精准的句法特征表示。
S6:将若干个所述训练语句的语义特征表示以及句法特征表示输入至所述特征交互模块中进行特征交互,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量。
在本实施例中,分析设备将若干个所述训练语句的语义特征表示以及句法特征表示输入至所述特征交互模块中进行特征交互,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量。通过特征交互的方法,对语义特征表示以及句法特征表示进行增强,并基于方面词对应的句法交互特征向量以及语义交互特征向量作为所述情感分析模型的训练数据,进一步提高所述情感分析模型对于情感分析的准确性。
请参阅图4,图4为本申请一个实施例提供的语句情感分析方法中S6的流程示意图,包括步骤S61~S62,具体如下:
S61:根据若干个所述训练语句的语义特征表示、句法特征表示以及预设的双仿射特征交互算法,获得若干个所述训练语句的语义交互特征表示以及句法交互特征表示。
所述双仿射特征交互算法为:
Figure SMS_40
式中,
Figure SMS_41
为所述语义交互特征表示,softmax()为归一化函数,
Figure SMS_42
为所述句法交互特征表示,
Figure SMS_43
为所述特征交互模块的第一可训练权重参数矩阵;
Figure SMS_44
为所述特征交互模块的第二可训练权重参数矩阵。
为了更加有效地将增强后的句法特征表示与语义特征表示进行交互,在本实施例中,分析设备采用双仿射机制,根据若干个所述训练语句的语义特征表示、句法特征表示以及预设的双仿射特征交互算法,获得若干个所述训练语句的语义交互特征表示以及句法交互特征表示。
S62:从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量。
在本实施例中,分析设备从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量。
具体地,分析设备从所述句法交互特征表示中,提取所有方面词对应的句法交互特征向量,并进行平均池化处理,获得若干个所述训练语句的方面词对应的句法交互特征向量,其中,所述句法交互特征向量为:
Figure SMS_45
式中,
Figure SMS_46
为方面词对应的语义交互特征向量,
Figure SMS_47
为方面词中的,在所述训练语句中的终止位置的单词的语义交互特征向量,
Figure SMS_48
为平均池化函数。
分析设备从所述语义交互特征表示中,提取所有方面词对应的语义交互特征向量,并进行平均池化处理,获得若干个所述训练语句的方面词对应的语义交互特征向量,其中,所述语义交互特征向量为:
Figure SMS_49
式中,
Figure SMS_50
为方面词对应的语义交互特征向量,
Figure SMS_51
为方面词中的在所述训练语句中的终止位置的单词的语义交互特征向量。
S7:将同一个训练语句的方面词对应的句法交互特征向量以及语义交互特征向量进行拼接,获得若干个所述训练语句的拼接特征向量,将若干个所述训练语句的拼接特征向量输入至所述情感分析模块中进行情感分析,获取若干个所述训练语句的预测情感向量以及预测情感极性。
在本实施例中,分析设备将同一个训练语句的方面词对应的句法交互特征向量以及语义交互特征向量进行拼接,获得若干个所述训练语句的拼接特征向量,其中,所述拼接特征向量为:
Figure SMS_52
式中,q为所述拼接特征向量。
分析设备将若干个所述训练语句的拼接特征向量输入至所述情感分析模块中进行情感分析,获取若干个所述训练语句的预测情感向量以及预测情感极性。
请参阅图5,图5为本申请一个实施例提供的语句情感分析方法中S7的流程示意图,包括步骤S71~S72,具体如下:
S71:根据若干个所述训练语句的拼接特征向量以及预设的预测情感向量计算算法,获取所述若干个所述训练语句的预测情感向量。
所述预测情感向量计算算法为:
Figure SMS_53
式中,
Figure SMS_54
为所述预测情感向量,q为所述方面词的拼接特征向量,
Figure SMS_55
为所述情感分析模块的可训练权重参数矩阵,softmax()为归一化函数,
Figure SMS_56
为所述情感分析模块的偏置参数;
在本实施例中,分析设备根据若干个所述训练语句的拼接特征向量以及预设的预测情感向量计算算法,获取所述若干个所述训练语句的预测情感向量。
S72:根据所述若干个所述训练语句的预测情感向量,获取概率最大的维度对应的情感极性,获取若干个所述训练语句的预测情感极性。
在本实施例中,分析设备根据所述若干个所述训练语句的预测情感向量,获取概率最大的维度对应的情感极性,作为若干个所述训练语句的预测情感极性。具体地,当分析设备计算得到
Figure SMS_57
=[
Figure SMS_58
Figure SMS_59
Figure SMS_60
]=[0.1,0.5,0.4],概率最大为
Figure SMS_61
,获取
Figure SMS_62
对应的情感极性,作为所述待测语句的情感分析结果。
S8:采用匿名游走方法,对若干个所述训练语句的依存句法图进行句法结构信息提取,获取若干个所述训练语句的句法结构特征数据。
考虑到依存句法图中含有丰富的结构模式信息,在本实施例中,分析设备采用匿名游走方法,对若干个所述训练语句的依存句法图进行句法结构信息提取,获取若干个所述训练语句的句法结构特征数据。
请参阅图6,图6为本申请一个实施例提供的语句情感分析方法中S8的流程示意图,包括步骤S81~S83,具体如下:
S81:根据预设的游走步长,以所述方面词节点作为起始点,分别对若干个所述训练语句的依存句法图上单词节点进行遍历,获取若干个所述训练语句的随机游走集。
针对于特定目标情感分类,在本实施例中,分析设备根据预设的游走步长,以所述方面词节点作为起始点,分别对若干个所述训练语句的依存句法图上单词节点进行遍历,获取若干个所述训练语句的随机游走集,其中,所述随机游走集包括若干条随机游走,其中,所述随机游走的表达式为:
Figure SMS_63
式中,rw为所述随机游走,
Figure SMS_64
表示第i个单词节点。
S82:对若干个所述训练语句的随机游走集合中的若干条随机游走进行匿名游走转换,获取若干条随机游走对应的匿名游走,对同一个训练语句的若干条随机游走对应的匿名游走进行组合,构建若干个所述训练语句的匿名游走集。
在本实施例中,分析设备对若干个所述训练语句的随机游走集合中的若干条随机游走进行匿名游走转换,获取若干条随机游走对应的匿名游走,对同一个训练语句的若干条随机游走对应的匿名游走进行组合,构建若干个所述训练语句的匿名游走集,其中,所述匿名游走集包括若干条匿名游走,所述匿名游走的表达式为:
Figure SMS_65
式中,
Figure SMS_66
为第c条随机游走对应的匿名游走,
Figure SMS_67
为第i个单词节点第一次出现在第c条随机游走时的索引。
S83:根据若干个所述训练语句的随机游走集、匿名游走集以及预设的概率分布计算算法,获得若干个所述训练语句的概率分布数据,作为所述句法结构特征数据。
所述概率分布计算算法为:
Figure SMS_68
式中,I为所述游走步长,t为匿名游走的索引,c为随机游走的索引,
Figure SMS_70
为游走步长为I的第t条匿名游走,
Figure SMS_76
为游走步长为I的第t条匿名游走的概率值,
Figure SMS_77
为第c条随机游走,
Figure SMS_71
为所述随机游走集,
Figure SMS_72
为第c条随机游走对应的匿名游走,
Figure SMS_73
为指示函数,
Figure SMS_75
为随机游走的数目,
Figure SMS_69
为匿名游走的数目,
Figure SMS_74
为所述概率分布数据。
在本实施例中,分析设备根据若干个所述训练语句的随机游走集、匿名游走集以及预设的概率分布计算算法,获得若干个所述训练语句的概率分布数据,作为所述句法结构特征数据,利用匿名游走捕获每条随机游走在句法图上方面词节点的邻域结构模式分布,实现了对若干个所述训练语句的句法结构信息的提取。
S9:根据若干个所述训练语句的预测情感向量、预测情感极性、真实情感向量、真实情感极性、句法交互特征表示以及语义交互特征表示以及句法结构特征数据以及预设的损失函数,对所述待训练的情感分析模型进行训练,获得目标情感分析模型。
在本实施例中,分析设备根据若干个所述训练语句的预测情感向量、预测情感极性、真实情感向量、真实情感极性、句法交互特征表示以及语义交互特征表示以及句法结构特征数据以及预设的损失函数,对所述待训练的情感分析模型进行训练,获得目标情感分析模型。
请参阅图7,图7为本申请一个实施例提供的语句情感分析方法中S9的流程示意图,包括步骤S91~S94,具体如下:
S91:根据所述若干个训练语句的预测情感极性、真实情感极性以及预设的第一损失函数,获得第一损失值。
所述第一损失函数为:
Figure SMS_78
式中,
Figure SMS_79
为所述第一损失值,B为所述批次中训练语句的数目,u为所述训练语句的索引,z为预设的情感类别的索引,
Figure SMS_80
为第u个训练语句的真实预测情感极性,
Figure SMS_81
为第u个训练语句的预测情感极性。
在本实施例中,分析设备根据所述若干个训练语句的预测情感极性、真实情感极性以及预设的第一损失函数,获得第一损失值。
S92:基于所述预测情感极性,构建正例训练语句特征集以及负例训练语句特征集。
在本实施例中,分析设备基于所述预测情感极性,构建正例训练语句特征集以及负例训练语句特征集,其中,所述正例训练语句特征集包括相同预测情感极性的若干个训练语句的方面词的拼接特征向量以及句法结构特征数据,所述负例训练语句特征集包括不同预测情感极性的若干个训练语句的方面词的拼接特征向量以及句法结构特征数据。
S93:根据所述正例训练语句特征集、负例训练语句特征集以及预设的第二损失函数,获得第二损失值。
所述第二损失函数为:
Figure SMS_82
式中,
Figure SMS_83
为所述第二损失值,e、x、k、m均为所述训练语句的索引,
Figure SMS_84
为第e个训练语句的方面词的拼接特征向量,
Figure SMS_85
为第x个训练语句的方面词的拼接特征向量,
Figure SMS_86
为第e个训练语句的概率分布数据,
Figure SMS_87
为第x个训练语句的概率分布数据,KL()为相对熵计算函数,
Figure SMS_88
为中间参数,P为所述正例训练语句特征集的拼接特征向量的数量,sim()为余弦相似度函数,τ为温度系数,
Figure SMS_89
为分布相似度参数。
在本实施例中,分析设备根据所述正例训练语句特征集、负例训练语句特征集以及预设的第二损失函数,获得第二损失值。
为了充分利用提取到的句法结构信息,利用对比学习方法,结合提取到的句法结构信息,通过KL散度计算正例训练语句特征集以及负例训练语句特征集对应的训练语句的分布相似度参数,并将其作为每个对比学习损失项的对比系数。带有对比系数的对比学习会鼓励模型在嵌入空间拉近情感极性一致的正例对时,会进一步拉近方面词节点邻域结构相似的正例对,从而提高训练后的情感分析模型的情感分析的精准度。
S94:根据所述第一损失值、第二损失值以及预设的总损失函数,获取总损失值,根据所述总损失值,对所述待训练的情感分析模型进行优化训练,获得训练好的情感分析模型。
所述总损失函数为:
Figure SMS_90
式中,
Figure SMS_91
为所述待训练的情感分析模型中所有可训练参数,
Figure SMS_92
为所述总损失值,
Figure SMS_93
为所述第二损失值,
Figure SMS_94
为预设的超参数。
在本实施例中,分析设备根据所述第一损失值、第二损失值以及预设的总损失函数,获取总损失值,根据所述总损失值,对所述待训练的情感分析模型进行优化训练,获得训练好的情感分析模型。
S10:获取待测语句,将所述待测语句输入至所述目标情感分析模型中,获得所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
在本实施例中,分析设备获取用户输入的待测语句,将所述待测语句输入至所述目标情感分析模型中,获得所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
请参阅图8,图8为本申请一个实施例提供的基于句法结构增强的语句情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现语句情感分析方法的全部或一部分,该装置8包括:
数据获取模块80,用于获取预设批次的训练语句集以及情感标签集,其中,所述训练语句集中包括若干个训练语句,所述情感标签集包括若干个训练语句的真实情感向量以及真实情感极性;
模型获取模块81,用于获取待训练的情感分析模型,其中,所述待训练的情感分析模型包括句子编码模块、语义图卷积模块、句法图卷积模块、特征交互模块以及情感分析模块;
句子编码模块82,用于将将所述训练语句集输入至所述句子编码模块中,获取若干个所述训练语句的句子特征表示;
语义特征提取模块83,用于将若干个所述训练语句的句子特征表示输入至所述语义图卷积模块中,获得若干个所述训练语句的语义特征表示;
句法特征提取模块84,用于构建若干个所述训练语句的依存句法图,根据若干个所述训练语句的初始句法图,构建若干个所述训练语句的第一句法邻接矩阵,将所述句子特征表示以及第一句法邻接矩阵输入至所述句法图卷积模块中,获得若干个所述训练语句的句法特征表示;
特征交互模块85,用于将若干个所述训练语句的语义特征表示以及句法特征表示输入至所述特征交互模块中进行特征交互,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量;
情感分析模块86,用于将同一个训练语句的方面词对应的句法交互特征向量以及语义交互特征向量进行拼接,获得若干个所述训练语句的拼接特征向量,将若干个所述训练语句的拼接特征向量输入至所述情感分析模块中进行情感分析,获取若干个所述训练语句的预测情感向量以及预测情感极性;
句法结构特征提取模块87,用于采用匿名游走方法,对若干个所述训练语句的依存句法图进行句法结构信息提取,获取若干个所述训练语句的句法结构特征数据;
模型训练模块88,用于根据若干个所述训练语句的预测情感向量、预测情感极性、真实情感向量、真实情感极性、句法交互特征表示以及语义交互特征表示以及句法结构特征数据以及预设的损失函数,对所述待训练的情感分析模型进行训练,获得目标情感分析模型;
情感预测模块89,用于获取待测语句,将所述待测语句输入至所述目标情感分析模型中,获得所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
在本申请的实施例中,通过数据获取模块,获取预设批次的训练语句集以及情感标签集,其中,所述训练语句集中包括若干个训练语句,所述情感标签集包括若干个训练语句的真实情感向量以及真实情感极性;通过模型获取模块,获取待训练的情感分析模型,其中,所述待训练的情感分析模型包括句子编码模块、语义图卷积模块、句法图卷积模块、特征交互模块以及情感分析模块;通过句子编码模块,将将所述训练语句集输入至所述句子编码模块中,获取若干个所述训练语句的句子特征表示;通过语义特征提取模块,将若干个所述训练语句的句子特征表示输入至所述语义图卷积模块中,获得若干个所述训练语句的语义特征表示;通过句法图卷积模块,构建若干个所述训练语句的依存句法图,根据若干个所述训练语句的初始句法图,构建若干个所述训练语句的第一句法邻接矩阵,将所述句子特征表示以及第一句法邻接矩阵输入至所述句法图卷积模块中,获得若干个所述训练语句的句法特征表示;通过特征交互模块,将若干个所述训练语句的语义特征表示以及句法特征表示输入至所述特征交互模块中进行特征交互,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量;通过情感分析模块,将同一个训练语句的方面词对应的句法交互特征向量以及语义交互特征向量进行拼接,获得若干个所述训练语句的拼接特征向量,将若干个所述训练语句的拼接特征向量输入至所述情感分析模块中进行情感分析,获取若干个所述训练语句的预测情感向量以及预测情感极性;通过句法结构特征提取模块,采用匿名游走方法,对若干个所述训练语句的依存句法图进行句法结构信息提取,获取若干个所述训练语句的句法结构特征数据;通过模型训练模块,根据若干个所述训练语句的预测情感向量、预测情感极性、真实情感向量、真实情感极性、句法交互特征表示以及语义交互特征表示以及句法结构特征数据以及预设的损失函数,对所述待训练的情感分析模型进行训练,获得目标情感分析模型;通过情感预测模块,获取待测语句,将所述待测语句输入至所述目标情感分析模型中,获得所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。获得训练语句的句法信息以及语义信息,采用匿名游走方法,对训练语句的句法结构信息进行提取,并将提取到的句法结构信息、训练语句的句法信息以及语义信息作为训练数据对模型进行训练,增强了模型句法依赖解析能力,提高了模型对句法结构分析的准确性,能够更加全面地对语句进行情感分析,提高情感分析的精准性以及效率。
请参考图9,图9为本申请一个实施例提供的计算机设备的结构示意图,计算机设备9包括:处理器91、存储器92以及存储在存储器92上并可在处理器91上运行的计算机程序93;计算机设备可以存储有多条指令,指令适用于由处理器91加载并执行上述图1至图7所示实施例的方法步骤,具体执行过程可以参见所述图1至图7所示实施例的具体说明,在此不进行赘述。
其中,处理器91可以包括一个或多个处理核心。处理器91利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器92内的指令、程序、代码集或指令集,以及调用存储器92内的数据,执行基于句法结构增强的语句情感分析装置8的各种功能和处理数据,可选的,处理器91可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programble Logic Array,PLA)中的至少一个硬件形式来实现。处理器91可集成中央处理器91(Central ProcessingUnit,CPU)、图像处理器91(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器91中,单独通过一块芯片进行实现。
其中,存储器92可以包括随机存储器92(Random Access Memory,RAM),也可以包括只读存储器92(Read-OnlyMemory)。可选的,该存储器92包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器92可用于存储指令、程序、代码、代码集或指令集。存储器92可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器92可选的还可以是至少一个位于远离前述处理器91的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行所示实施例一至实施例三的方法步骤,具体执行过程可以参见所示所述图1至图7所示实施例的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。

Claims (7)

1.一种语句情感分析方法,其特征在于,包括以下步骤:
获取预设批次的训练语句集以及情感标签集,其中,所述训练语句集中包括若干个训练语句,所述训练语句包括若干个单词,所述单词包括若干个上下文单词以及方面词,所述情感标签集包括若干个训练语句的真实情感向量以及真实情感极性;
获取待训练的情感分析模型,其中,所述待训练的情感分析模型包括句子编码模块、语义图卷积模块、句法图卷积模块、特征交互模块以及情感分析模块,其中,所述语义图卷积模块包括第一多层图卷积网络,所述句法图卷积模块包括第二多层图卷积网络;
将所述训练语句集输入至所述句子编码模块中,获取若干个所述训练语句的句子特征表示;
将若干个所述训练语句的句子特征表示输入至所述语义图卷积模块中,根据若干个所述训练语句的句子特征表示以及预设的自注意力计算算法,构建若干个所述训练语句的语义邻接矩阵,其中,所述自注意力计算算法为:
Figure QLYQS_1
式中,
Figure QLYQS_2
为所述语义邻接矩阵,softmax为归一化函数,
Figure QLYQS_3
为所述句子特征表示,
Figure QLYQS_4
为所述语义图卷积模块的第一可训练权重参数,
Figure QLYQS_5
为所述语义图卷积模块的第二可训练权重参数,d为维度参数;
分别将若干个所述训练语句的句子特征表示作为所述第一多层图卷积网络的首层输入数据,根据若干个所述训练语句的语义邻接矩阵以及预设的语义特征计算算法,获得若干个所述训练语句的语义特征表示,其中,所述语义特征计算算法为:
Figure QLYQS_6
式中,
Figure QLYQS_7
为所述第一多层图卷积网络的第l+1层的语义特征表示,
Figure QLYQS_8
为所述第一多层图卷积网络的第l层的语义特征表示,
Figure QLYQS_9
为非线性激活函数,
Figure QLYQS_10
为所述第一多层图卷积网络的第l层的可训练权重参数矩阵,
Figure QLYQS_11
为所述第一多层图卷积网络的第l层的偏差参数;
构建若干个所述训练语句的依存句法图,根据若干个所述训练语句的初始句法图,构建若干个所述训练语句的第一句法邻接矩阵,所述第一句法邻接矩阵包括若干个单词节点之间的句法依赖数据,将所述句子特征表示以及第一句法邻接矩阵输入至所述句法图卷积模块中,将若干个所述训练语句的第一句法邻接矩阵中若干个单词之间的句法依赖数据转换为相应的句法依赖向量,根据预设的方面感知注意力算法,获得若干个所述训练语句的若干个单词之间的注意力系数,其中,所述方面感知注意力算法为:
Figure QLYQS_12
式中,ij为单词的索引参数,
Figure QLYQS_13
为第i个单词节点与第j个单词节点之间的注意力系数,
Figure QLYQS_14
为第i个单词节点与第j个单词节点之间的句法依赖向量,
Figure QLYQS_15
为预设的第一可训练权重参数矩阵,
Figure QLYQS_16
为预设的第二可训练权重参数矩阵,
Figure QLYQS_17
为预设的第一偏置参数,
Figure QLYQS_18
为预设的第二偏置参数,
Figure QLYQS_19
为单词节点数目;
根据若干个所述训练语句的方面词与若干个上下文单词之间的注意力系数,对若干个所述训练语句的第一句法邻接矩阵中相应的所述方面词与若干个上下文单词之间的句法依赖数据进行更新,获得若干个所述训练语句的第二句法邻接矩阵;
分别将若干个所述训练语句的句子特征表示作为所述第二多层图卷积网络的首层输入数据,根据若干个所述训练语句的第二句法邻接矩阵以及预设的句法特征计算算法,获得若干个所述训练语句的句法特征表示,其中,所述句法特征计算算法为:
Figure QLYQS_20
式中,
Figure QLYQS_21
为所述第二多层图卷积网络的第l+1层的句法特征表示,
Figure QLYQS_22
为所述第二多层图卷积网络的第l层的句法特征表示,
Figure QLYQS_23
为非线性激活函数,
Figure QLYQS_24
为所述第二句法邻接矩阵,
Figure QLYQS_25
为所述第二多层图卷积网络的第l层的可训练权重参数矩阵,
Figure QLYQS_26
为所述第二多层图卷积网络的第l层的偏差参数;
将若干个所述训练语句的语义特征表示以及句法特征表示输入至所述特征交互模块中进行特征交互,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量;
将同一个训练语句的方面词对应的句法交互特征向量以及语义交互特征向量进行拼接,获得若干个所述训练语句的拼接特征向量,将若干个所述训练语句的拼接特征向量输入至所述情感分析模块中进行情感分析,获取若干个所述训练语句的预测情感向量以及预测情感极性;
采用匿名游走方法,对若干个所述训练语句的依存句法图进行句法结构信息提取,获取若干个所述训练语句的句法结构特征数据;
根据若干个所述训练语句的预测情感向量、预测情感极性、真实情感向量、真实情感极性、句法交互特征表示以及语义交互特征表示以及句法结构特征数据以及预设的损失函数,对所述待训练的情感分析模型进行训练,获得目标情感分析模型;
获取待测语句,将所述待测语句输入至所述目标情感分析模型中,获得所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
2.根据权利要求1所述的语句情感分析方法,其特征在于:
所述初始句法图包括若干个单词节点,所述单词节点包括方面词节点;
所述采用匿名游走方法,对若干个所述训练语句的依存句法图进行句法结构信息提取,获取若干个所述训练语句的句法结构特征数据,包括步骤:
根据预设的游走步长,以所述方面词节点作为起始点,分别对若干个所述训练语句的依存句法图上单词节点进行遍历,获取若干个所述训练语句的随机游走集,其中,所述随机游走集包括若干条随机游走;
对若干个所述训练语句的随机游走集合中的若干条随机游走进行匿名游走转换,获取若干条随机游走对应的匿名游走,对同一个训练语句的若干条随机游走对应的匿名游走进行组合,构建若干个所述训练语句的匿名游走集,其中,所述匿名游走集包括若干条匿名游走;
根据若干个所述训练语句的随机游走集、匿名游走集以及预设的概率分布计算算法,获得若干个所述训练语句的概率分布数据,作为所述句法结构特征数据,其中,所述概率分布计算算法为:
Figure QLYQS_27
式中,I为所述游走步长,t为匿名游走的索引,c为随机游走的索引,
Figure QLYQS_30
为游走步长为I的第t条匿名游走,
Figure QLYQS_32
为游走步长为I的第t条匿名游走的概率值,
Figure QLYQS_34
为第c条随机游走,
Figure QLYQS_29
为所述随机游走集,
Figure QLYQS_33
为第c条随机游走对应的匿名游走,
Figure QLYQS_35
为指示函数,
Figure QLYQS_36
为随机游走的数目,
Figure QLYQS_28
为匿名游走的数目,
Figure QLYQS_31
为所述概率分布数据。
3.根据权利要求1所述的语句情感分析方法,其特征在于,所述将若干个所述训练语句的语义特征表示以及句法特征表示输入至所述特征交互模块中进行特征交互,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量,包括步骤:
根据若干个所述训练语句的语义特征表示、句法特征表示以及预设的双仿射特征交互算法,获得若干个所述训练语句的语义交互特征表示以及句法交互特征表示,其中,所述双仿射特征交互算法为:
Figure QLYQS_37
式中,
Figure QLYQS_38
为所述语义交互特征表示,softmax()为归一化函数,
Figure QLYQS_39
为所述句法交互特征表示,
Figure QLYQS_40
为所述特征交互模块的第一可训练权重参数矩阵;
Figure QLYQS_41
为所述特征交互模块的第二可训练权重参数矩阵;
从所述句法交互特征表示以及语义交互特征表示中,分别提取所述方面词对应的句法交互特征向量以及语义交互特征向量,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量。
4.根据权利要求1所述的语句情感分析方法,其特征在于,所述将若干个所述训练语句的拼接特征向量输入至所述情感分析模块中进行情感分析,获取若干个所述训练语句的预测情感向量以及预测情感极性,包括步骤:
根据若干个所述训练语句的拼接特征向量以及预设的预测情感向量计算算法,获取所述若干个所述训练语句的预测情感向量,其中,所述预测情感向量计算算法为:
Figure QLYQS_42
式中,
Figure QLYQS_43
为所述预测情感向量,q为所述方面词的拼接特征向量,
Figure QLYQS_44
为所述情感分析模块的可训练权重参数矩阵,softmax()为归一化函数,
Figure QLYQS_45
为所述情感分析模块的偏置参数;
根据所述若干个所述训练语句的预测情感向量,获取概率最大的维度对应的情感极性,获取若干个所述训练语句的预测情感极性。
5.根据权利要求4所述的语句情感分析方法,其特征在于,所述根据若干个所述训练语句的预测情感向量、预测情感极性、真实情感向量、真实情感极性、句法交互特征表示以及语义交互特征表示以及句法结构特征数据以及预设的损失函数,对所述待训练的情感分析模型进行训练,获得目标情感分析模型,包括步骤:
根据所述若干个训练语句的预测情感极性、真实情感极性以及预设的第一损失函数,获得第一损失值,其中,所述第一损失函数为:
Figure QLYQS_46
式中,
Figure QLYQS_47
为所述第一损失值,B为所述批次中训练语句的数目,u为所述训练语句的索引,z为预设的情感类别的索引,
基于所述预测情感极性,构建正例训练语句特征集以及负例训练语句特征集,其中,所述正例训练语句特征集包括相同预测情感极性的若干个训练语句的方面词的拼接特征向量以及句法结构特征数据,所述负例训练语句特征集包括不同预测情感极性的若干个训练语句的方面词的拼接特征向量以及句法结构特征数据;
根据所述正例训练语句特征集、负例训练语句特征集以及预设的第二损失函数,获得第二损失值,其中,所述第二损失函数为:
Figure QLYQS_48
式中,
Figure QLYQS_49
为所述第二损失值,e、x、k、m均为所述训练语句的索引,
Figure QLYQS_50
为第e个训练语句的方面词的拼接特征向量,
Figure QLYQS_51
为第x个训练语句的方面词的拼接特征向量,
Figure QLYQS_52
为第e个训练语句的概率分布数据,
Figure QLYQS_53
为第x个训练语句的概率分布数据,KL()为相对熵计算函数,
Figure QLYQS_54
为中间参数,P为所述正例训练语句特征集的拼接特征向量的数量,sim()为余弦相似度函数,τ为温度系数,
Figure QLYQS_55
为分布相似度参数;
根据所述第一损失值、第二损失值以及预设的总损失函数,获取总损失值,根据所述总损失值,对所述待训练的情感分析模型进行优化训练,获得训练好的情感分析模型,其中,所述总损失函数为:
Figure QLYQS_56
式中,
Figure QLYQS_57
为所述待训练的情感分析模型中所有可训练参数,
Figure QLYQS_58
为所述总损失值,
Figure QLYQS_59
为所述第二损失值,
Figure QLYQS_60
为预设的超参数。
6.一种基于句法结构增强的语句情感分析装置,其特征在于,包括:
数据获取模块,用于获取预设批次的训练语句集以及情感标签集,其中,所述训练语句集中包括若干个训练语句,所述训练语句包括若干个单词,所述单词包括若干个上下文单词以及方面词,所述情感标签集包括若干个训练语句的真实情感向量以及真实情感极性;
模型获取模块,用于获取待训练的情感分析模型,其中,所述待训练的情感分析模型包括句子编码模块、语义图卷积模块、句法图卷积模块、特征交互模块以及情感分析模块,其中,所述语义图卷积模块包括第一多层图卷积网络,所述句法图卷积模块包括第二多层图卷积网络;
句子编码模块,用于将所述训练语句集输入至所述句子编码模块中,获取若干个所述训练语句的句子特征表示;
语义特征提取模块,用于将若干个所述训练语句的句子特征表示输入至所述语义图卷积模块中,根据若干个所述训练语句的句子特征表示以及预设的自注意力计算算法,构建若干个所述训练语句的语义邻接矩阵,其中,所述自注意力计算算法为:
Figure QLYQS_61
式中,
Figure QLYQS_62
为所述语义邻接矩阵,softmax为归一化函数,
Figure QLYQS_63
为所述句子特征表示,
Figure QLYQS_64
为所述语义图卷积模块的第一可训练权重参数,
Figure QLYQS_65
为所述语义图卷积模块的第二可训练权重参数,d为维度参数;
分别将若干个所述训练语句的句子特征表示作为所述第一多层图卷积网络的首层输入数据,根据若干个所述训练语句的语义邻接矩阵以及预设的语义特征计算算法,获得若干个所述训练语句的语义特征表示,其中,所述语义特征计算算法为:
Figure QLYQS_66
式中,
Figure QLYQS_67
为所述第一多层图卷积网络的第l+1层的语义特征表示,
Figure QLYQS_68
为所述第一多层图卷积网络的第l层的语义特征表示,
Figure QLYQS_69
为非线性激活函数,
Figure QLYQS_70
为所述第一多层图卷积网络的第l层的可训练权重参数矩阵,
Figure QLYQS_71
为所述第一多层图卷积网络的第l层的偏差参数;
句法特征提取模块,用于构建若干个所述训练语句的依存句法图,根据若干个所述训练语句的初始句法图,构建若干个所述训练语句的第一句法邻接矩阵,所述第一句法邻接矩阵包括若干个单词节点之间的句法依赖数据,将所述句子特征表示以及第一句法邻接矩阵输入至所述句法图卷积模块中,将若干个所述训练语句的第一句法邻接矩阵中若干个单词之间的句法依赖数据转换为相应的句法依赖向量,根据预设的方面感知注意力算法,获得若干个所述训练语句的若干个单词之间的注意力系数,其中,所述方面感知注意力算法为:
Figure QLYQS_72
式中,ij为单词的索引参数,
Figure QLYQS_73
为第i个单词节点与第j个单词节点之间的注意力系数,
Figure QLYQS_74
为第i个单词节点与第j个单词节点之间的句法依赖向量,
Figure QLYQS_75
为预设的第一可训练权重参数矩阵,
Figure QLYQS_76
为预设的第二可训练权重参数矩阵,
Figure QLYQS_77
为预设的第一偏置参数,
Figure QLYQS_78
为预设的第二偏置参数,
Figure QLYQS_79
为单词节点数目;
根据若干个所述训练语句的方面词与若干个上下文单词之间的注意力系数,对若干个所述训练语句的第一句法邻接矩阵中相应的所述方面词与若干个上下文单词之间的句法依赖数据进行更新,获得若干个所述训练语句的第二句法邻接矩阵;
分别将若干个所述训练语句的句子特征表示作为所述第二多层图卷积网络的首层输入数据,根据若干个所述训练语句的第二句法邻接矩阵以及预设的句法特征计算算法,获得若干个所述训练语句的句法特征表示,其中,所述句法特征计算算法为:
Figure QLYQS_80
式中,
Figure QLYQS_81
为所述第二多层图卷积网络的第l+1层的句法特征表示,
Figure QLYQS_82
为所述第二多层图卷积网络的第l层的句法特征表示,
Figure QLYQS_83
为非线性激活函数,
Figure QLYQS_84
为所述第二句法邻接矩阵,
Figure QLYQS_85
为所述第二多层图卷积网络的第l层的可训练权重参数矩阵,
Figure QLYQS_86
为所述第二多层图卷积网络的第l层的偏差参数;
特征交互模块,用于将若干个所述训练语句的语义特征表示以及句法特征表示输入至所述特征交互模块中进行特征交互,获得若干个所述训练语句的方面词对应的句法交互特征向量以及语义交互特征向量;
情感分析模块,用于将同一个训练语句的方面词对应的句法交互特征向量以及语义交互特征向量进行拼接,获得若干个所述训练语句的拼接特征向量,将若干个所述训练语句的拼接特征向量输入至所述情感分析模块中进行情感分析,获取若干个所述训练语句的预测情感向量以及预测情感极性;
句法结构特征提取模块,用于采用匿名游走方法,对若干个所述训练语句的依存句法图进行句法结构信息提取,获取若干个所述训练语句的句法结构特征数据;
模型训练模块,用于根据若干个所述训练语句的预测情感向量、预测情感极性、真实情感向量、真实情感极性、句法交互特征表示以及语义交互特征表示以及句法结构特征数据以及预设的损失函数,对所述待训练的情感分析模型进行训练,获得目标情感分析模型;
情感预测模块,用于获取待测语句,将所述待测语句输入至所述目标情感分析模型中,获得所述待测语句的预测情感极性,作为所述待测语句的情感分析结果。
7.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的语句情感分析方法的步骤。
CN202310100512.4A 2023-02-13 2023-02-13 语句情感分析方法、装置以及设备 Active CN115827878B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310100512.4A CN115827878B (zh) 2023-02-13 2023-02-13 语句情感分析方法、装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310100512.4A CN115827878B (zh) 2023-02-13 2023-02-13 语句情感分析方法、装置以及设备

Publications (2)

Publication Number Publication Date
CN115827878A CN115827878A (zh) 2023-03-21
CN115827878B true CN115827878B (zh) 2023-06-06

Family

ID=85521024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310100512.4A Active CN115827878B (zh) 2023-02-13 2023-02-13 语句情感分析方法、装置以及设备

Country Status (1)

Country Link
CN (1) CN115827878B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116304748B (zh) * 2023-05-17 2023-07-28 成都工业学院 一种文本相似度计算方法、系统、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528672A (zh) * 2020-12-14 2021-03-19 北京邮电大学 一种基于图卷积神经网络的方面级情感分析方法及装置
CN113449110A (zh) * 2021-08-30 2021-09-28 华南师范大学 情感分类方法、装置、存储介质及计算机设备
US11194972B1 (en) * 2021-02-19 2021-12-07 Institute Of Automation, Chinese Academy Of Sciences Semantic sentiment analysis method fusing in-depth features and time sequence models
CN115204183A (zh) * 2022-09-19 2022-10-18 华南师范大学 基于知识增强的双通道情感分析方法、装置以及设备
CN115587597A (zh) * 2022-11-23 2023-01-10 华南师范大学 基于子句级关系图的方面词的情感分析方法以及装置
CN115618884A (zh) * 2022-11-16 2023-01-17 华南师范大学 基于多任务学习的言论分析方法、装置以及设备
CN115659951A (zh) * 2022-12-26 2023-01-31 华南师范大学 基于标签嵌入的语句情感分析方法、装置以及设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528672A (zh) * 2020-12-14 2021-03-19 北京邮电大学 一种基于图卷积神经网络的方面级情感分析方法及装置
US11194972B1 (en) * 2021-02-19 2021-12-07 Institute Of Automation, Chinese Academy Of Sciences Semantic sentiment analysis method fusing in-depth features and time sequence models
CN113449110A (zh) * 2021-08-30 2021-09-28 华南师范大学 情感分类方法、装置、存储介质及计算机设备
CN115204183A (zh) * 2022-09-19 2022-10-18 华南师范大学 基于知识增强的双通道情感分析方法、装置以及设备
CN115618884A (zh) * 2022-11-16 2023-01-17 华南师范大学 基于多任务学习的言论分析方法、装置以及设备
CN115587597A (zh) * 2022-11-23 2023-01-10 华南师范大学 基于子句级关系图的方面词的情感分析方法以及装置
CN115659951A (zh) * 2022-12-26 2023-01-31 华南师范大学 基于标签嵌入的语句情感分析方法、装置以及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王家乾 ; 龚子寒 ; 薛云 ; 庞士冠 ; 古东宏 ; .基于混合多头注意力和胶囊网络的特定目标情感分析.中文信息学报.2020,(05),100-110页. *

Also Published As

Publication number Publication date
CN115827878A (zh) 2023-03-21

Similar Documents

Publication Publication Date Title
CN112131383B (zh) 特定目标的情感极性分类方法
CN112633010A (zh) 基于多头注意力和图卷积网络的方面级情感分析方法及系统
CN116402063B (zh) 多模态讽刺识别方法、装置、设备以及存储介质
CN114676704B (zh) 句子情感分析方法、装置、设备以及存储介质
CN110399547B (zh) 用于更新模型参数的方法、装置、设备和存储介质
CN116089619B (zh) 情感分类方法、装置、设备以及存储介质
CN116151263B (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN115587597B (zh) 基于子句级关系图的方面词的情感分析方法以及装置
CN115659987B (zh) 基于双通道的多模态命名实体识别方法、装置以及设备
CN114186076A (zh) 知识图谱构建方法、装置、设备和计算机可读存储介质
CN116910307A (zh) 一种跨模态视频文本检索方法、系统、设备及介质
CN116258145B (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN115827878B (zh) 语句情感分析方法、装置以及设备
CN114331122A (zh) 重点人员风险等级评估方法及相关设备
CN116719520A (zh) 代码生成方法及装置
CN110852066A (zh) 一种基于对抗训练机制的多语言实体关系抽取方法及系统
CN115168592A (zh) 基于方面类别的语句情感分析方法、装置以及设备
CN117633516B (zh) 多模态嘲讽检测方法、装置、计算机设备以及存储介质
CN112559640B (zh) 图谱表征系统的训练方法及装置
CN113901789A (zh) 基于门控空洞卷积和图卷积的方面级情感分析方法及系统
CN115905518B (zh) 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN115525263A (zh) 代码补全模型的训练方法、代码补全方法和装置
CN115659951B (zh) 基于标签嵌入的语句情感分析方法、装置以及设备
CN115906863B (zh) 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115905524B (zh) 融合句法和语义信息的情感分析方法、装置以及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant