CN115168592B - 基于方面类别的语句情感分析方法、装置以及设备 - Google Patents

基于方面类别的语句情感分析方法、装置以及设备 Download PDF

Info

Publication number
CN115168592B
CN115168592B CN202211047550.XA CN202211047550A CN115168592B CN 115168592 B CN115168592 B CN 115168592B CN 202211047550 A CN202211047550 A CN 202211047550A CN 115168592 B CN115168592 B CN 115168592B
Authority
CN
China
Prior art keywords
sample
sentence
words
feature
representation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211047550.XA
Other languages
English (en)
Other versions
CN115168592A (zh
Inventor
肖峻阳
赵浩梁
薛云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202211047550.XA priority Critical patent/CN115168592B/zh
Publication of CN115168592A publication Critical patent/CN115168592A/zh
Application granted granted Critical
Publication of CN115168592B publication Critical patent/CN115168592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及情感分析领域,特别涉及一种基于方面类别的语句情感分析方法、装置、设备以及存储介质。通过样本语句以及样本语句的若干个方面类别组,构建句子特征表示集、词嵌入表示集以及方面类别表示集,采用深度学习方法,对神经网络模型进行训练,提高了基于方面类别的情感分析的精准性以及效率性,从而实现对语句的情感分析的准确以及稳定分析。

Description

基于方面类别的语句情感分析方法、装置以及设备
技术领域
本发明涉及情感分析领域,特别涉及是一种基于方面类别的语句情感分析方法、装置、设备以及存储介质。
背景技术
相比粗粒度情感分类,基于方面级的情感分析是一种细粒度的情感分类任务,识别句子中给定方面的情感极性。根据给定方面的不同,分为两个子任务:方面类别情感分析和方面术语情感分析。其中方面类别情感分析任务旨在识别句子给定方面类别的情感极性。
然而,方面类别情感分析所讨论的方面类别是预定义的类别,通常不会出现在句子中,导致目前基于位置向量和句法距离等信息的方法都无法准确构建方面类别和情感观点表达的联系,从而无法对语句进行准确的情感分析。
发明内容
基于此,本发明的目的在于,提供一种基于方面类别的语句情感分析方法、装置、设备以及存储介质,通过样本语句以及样本语句的若干个方面类别组,构建句子特征表示集、词嵌入表示集以及方面类别表示集,采用深度学习方法,对神经网络模型进行训练,提高了基于方面类别的情感分析的精准性以及效率性,从而实现对语句的情感分析的准确以及稳定分析。
第一方面,本申请实施例提供了一种基于方面类别的语句情感分析方法,包括以下步骤:
获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;
将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;
将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;
将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;
根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;
响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
第二方面,本申请实施例提供了一种基于方面类别的语句情感分析装置,包括:
语句获得模块,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;
编码模块,用于将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;
注意力计算模块,用于将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;
语义特征提取模块,用于将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
分布预测模块,用于将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;
训练模块,用于根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;
分析模块,用于响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述基于方面类别的语句情感分析方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于方面类别的语句情感分析方法的步骤。
在本申请实施例中,提供一种基于方面类别的语句情感分析方法、装置、设备以及存储介质,通过样本语句以及样本语句的若干个方面类别组,构建句子特征表示集、词嵌入表示集以及方面类别表示集,采用深度学习方法,对神经网络模型进行训练,提高了基于方面类别的情感分析的精准性以及效率性,从而实现对语句的情感分析的准确以及稳定分析。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请一个实施例提供的基于方面类别的语句情感分析方法的流程示意图;
图2为本申请一个实施例提供的基于方面类别的语句情感分析方法中S2的流程示意图;
图3为本申请一个实施例提供的基于方面类别的语句情感分析方法中S3的流程示意图;
图4为本申请一个实施例提供的基于方面类别的语句情感分析方法中S4的流程示意图;
图5为本申请一个实施例提供的基于方面类别的语句情感分析方法中S5的流程示意图;
图6为本申请一个实施例提供的基于方面类别的语句情感分析方法中S6的流程示意图;
图7为本申请一个实施例提供的基于方面类别的语句情感分析方法中S7的流程示意图;
图8为本申请一个实施例提供的基于方面类别的语句情感分析装置的结构示意图;
图9为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请一个实施例提供的基于方面类别的语句情感分析方法的流程示意图,所述方法包括如下步骤:
S1:获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词。
所述基于方面类别的语句情感分析方法的执行主体为基于方面类别的语句情感分析方法的分析设备(以下简称分析设备),在一个可选的实施例中,所述分析设备可以是一台计算机设备可以是服务器,或是多台计算机设备联合而成的服务器机群。
所述样本语句包括若干个单词,所述单词可以是名词、形容词等等。
在本实施例中,分析设备可以获得用户输入的若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述样本语句的若干个方面类别组,所述方面类别组包括若干个特征词,所述特征词体现了所述样本语句中的方面类别。
S2:将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集。
所述编码模块可以采用BERT(Bidirectional Encoder Representation fromTransformers)模型,也可以采用GloVe模型,用于对样本语句以及方面类别组的进行词嵌入处理。
在本实施例中,分析模块将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示。
所述特征词包括实体词以及属性词,在一个可选的实施例中,一组方面类别组由一个实体词以及属性词组成。请参阅图2,图2为本申请一个实施例提供的基于方面类别的语句情感分析方法中S2的流程示意图,包括步骤S201~S206,具体如下:
S201:将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句。
在本实施例中,分析设备将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句,例如,当该样本语句有相应的一个方面类别组,该方面类别组由一个实体词以及属性词组成,拼接处理后的样本语句的表达式为:
Figure 31213DEST_PATH_IMAGE001
式中,
Figure 100800DEST_PATH_IMAGE002
为样本语句的句子表示,
Figure 298563DEST_PATH_IMAGE003
为实体词的词表示,
Figure 236432DEST_PATH_IMAGE004
为属性词 的词表示,[CLS]以及[SEP]均为拼接处理中,关于BERT词嵌入模型的标记符号。
S202:将所述若干个拼接处理后的样本语句输入至所述神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示。
在本实施例中,分析设备将所述若干个拼接处理后的样本语句输入至所述神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示。
S203:将所述同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为所述句子特征表示集。
在本实施例中,分析设备将所述同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为所述句子特征表示集,其中,所述若干个样本语句的句子特征表示的表达式为:
Figure 468831DEST_PATH_IMAGE005
式中,
Figure 709319DEST_PATH_IMAGE006
表示第i个样本句子的词嵌入矩阵,
Figure 535324DEST_PATH_IMAGE007
为第i个样本语句的第n个单词对应 的词嵌入表示。
S204:将所述同一个拼接处理后样本语句的若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示进行组合,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,作为所述词嵌入特征表示集。
Figure 152250DEST_PATH_IMAGE008
式中,
Figure 973575DEST_PATH_IMAGE009
表示第i个样本语句的第k个方面类别组的词嵌入矩阵,
Figure 509599DEST_PATH_IMAGE010
为第i 个样本语句的第k个方面类别组的实体词对应的词嵌入表示,
Figure 681954DEST_PATH_IMAGE011
为第i个样本语 句的第k个方面类别组的属性词对应的词嵌入表示。
S205:将包含有所述同一实体词的拼接处理后的样本语句进行组合,获得所述若干个实体词对应的样本语句集,以及将包含有所述同一属性词的拼接处理后的样本语句进行组合,获得所述若干个属性词对应的样本语句集。
在本实施例中,分析设备将包含有所述同一实体词的拼接处理后的样本语句进行组合,获得所述若干个实体词对应的样本语句集,以及将包含有所述同一属性词的拼接处理后的样本语句进行组合,获得所述若干个属性词对应的样本语句集,所述实体词对应的样本语句集的表达式为:
Figure 836992DEST_PATH_IMAGE012
式中,
Figure 152305DEST_PATH_IMAGE013
为第i个样本语句中的第k个方面类别组的实体词对应的样本语 句集,
Figure 175DEST_PATH_IMAGE014
为该实体词对应的样本语句集中的第j个样本语句的句子表示。
所述属性词对应的样本语句集的表达式为:
Figure 659826DEST_PATH_IMAGE015
式中,
Figure 477610DEST_PATH_IMAGE016
为第i个样本语句中的第k个方面类别组的属性词对应的样 本语句集,
Figure 539107DEST_PATH_IMAGE017
为该属性词对应的样本语句集中的第j个样本语句的句子表示。
S206:将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为所述方面类别特征表示集。
在本实施例中,分析设备将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为所述方面类别特征表示集。
具体地,分析设备将所述实体词对应的样本语句集中的样本语句的句子表示进行拼接处理,获得所述实体词对应的样本语句集对应的总句子表示,所述实体词对应的样本语句集对应的总句子表示的表达式为:
Figure 557878DEST_PATH_IMAGE018
将所述实体词对应的样本语句集对应的总句子表示输入至所述神经网络模型中的编码模块,取BERT词嵌入模型的第j个样本语句前的拼接标记[CLS]对应的输出表示作为所述实体词对应的样本语句集中第j个样本语句的方面类别特征表示,如下所述:
Figure 49033DEST_PATH_IMAGE019
式中,
Figure 811453DEST_PATH_IMAGE020
为第i个样本语句中的第k个方面类别组的实体词对应的样本语 句集的关于样本语句的方面类别特征表示集,
Figure 727457DEST_PATH_IMAGE021
为该实体词对应的样本语句集中 的第j个样本语句的方面类别特征表示。
同理,分析设备将所述属性词对应的样本语句集中的样本语句的句子表示进行拼接处理,获得所述属性词对应的样本语句集对应的总句子表示,将所述属性词对应的样本语句集对应的总句子表示输入至所述神经网络模型中的编码模块,获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为所述方面类别特征表示集,具体如下:
Figure 776184DEST_PATH_IMAGE022
式中,
Figure 410428DEST_PATH_IMAGE023
为第i个样本语句中的第k个方面类别组中的属性词对应的样 本语句集的关于样本语句的方面类别特征表示集,
Figure 710959DEST_PATH_IMAGE024
为该属性词对应的样本语 句集中的第j个样本语句的方面类别特征表示。
S3:将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
在本实施例中,分析设备将所述词嵌入表示集以及方面类别特征表示集,输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
请参阅图3,图3为本申请一个实施例提供的基于方面类别的语句情感分析方法中S3的流程示意图,包括步骤S301~S304,具体如下:
S301:构建与所述样本语句相应的特征词相关联的图网络结构。
为了提取特征词体现的情感信息,在本实施例中,分析设备构建与所述样本语句相应的特征词相关联的图网络结构,其中,所述样本所述图网络包括中心节点以及若干个子节点。
S302:将所述特征词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将所述同一特征词对应的样本语句的方面类别特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的邻接矩阵。
在本实施例中,分析设备将所述特征词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将所述同一特征词对应的样本语句的方面类别特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的邻接矩阵。
在一个可选的实施例中,当一组方面类别组由一个实体词以及一个属性词组成,所述方面类别组的邻接矩阵包括实体词对应的邻接矩阵以及属性词对应的邻接矩阵,具体地,分析设备分别将所述实体词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将所述同一实体词对应的样本语句的句子特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的实体词对应的邻接矩阵,同理,分析设备构建所述若干个样本语句的若干个方面类别组的属性词对应的邻接矩阵。
S303:根据所述若干个特征词对应的样本语句的方面类别特征表示、相应的特征词对应的邻接矩阵以及所述图注意力网络模块的图注意力计算算法,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的注意力特征表示。
在本实施例中,分析设备根据所述若干个特征词对应的样本语句的方面类别特征表示、相应的特征词对应的邻接矩阵以及所述图注意力网络模块的图注意力计算算法,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的注意力特征表示,所述图注意力计算算法为:
Figure 481469DEST_PATH_IMAGE025
式中,
Figure 953295DEST_PATH_IMAGE026
为所述图注意力网络模块的第l层的特征词对应的注意力特征表示,ReLU()为激活函数,q为所述图网络结构的子节点的数目,
Figure 809255DEST_PATH_IMAGE027
为所述图注意力网络模块的 第l层的权重参数,
Figure 913478DEST_PATH_IMAGE028
为所述图注意力网络模块的第l层的可训练的位置关系矩阵,
Figure 663128DEST_PATH_IMAGE029
为所述图注意力网络模块的第l层的方面类别特征表示,
Figure 194603DEST_PATH_IMAGE030
为所述图注意力网络模块的第l层的偏置参数,
Figure 537860DEST_PATH_IMAGE031
为第j个样本语句的第k个方面类别组的邻接矩阵中节点之间关系,
Figure 55560DEST_PATH_IMAGE032
为所述图注意力网络模块的参数矩阵,
Figure 800662DEST_PATH_IMAGE033
为所述图注意力网络模块的第l-1层的特征词 对应的词嵌入表示;
其中,所述特征词对应的注意力特征表示包括所述实体词对应的注意力特征表示,以及所述属性词对应的注意力特征表示。
S304:根据所述同一个方面类别组的实体词对应的注意力特征表示、所述属性词对应的注意力特征表示以及预设的特征融合算法,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
所述特征融合算法为:
Figure 237460DEST_PATH_IMAGE034
式中,
Figure 192646DEST_PATH_IMAGE035
为第i个样本语句中的第k个方面类别组对应的注意力特征表示,
Figure 638671DEST_PATH_IMAGE036
为所述图注意力网络模块的第l层的实体词对应的注意力特征表示,
Figure 238280DEST_PATH_IMAGE037
为所述图注意力网络模块的第l层的属性词对应的注意力特征表示,
Figure 485459DEST_PATH_IMAGE038
为预设的第一可训练 权重参数,
Figure 537729DEST_PATH_IMAGE039
为预设的第二可训练权重参数。
在本实施例中,分析设备根据所述同一个方面类别组的实体词对应的注意力特征表示、所述属性词对应的注意力特征表示以及预设的特征融合算法,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
S4:将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示。
为了提高情感分析的准确性,在本实施例中,分析设备将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示,其中,所述语义特征表示包括第一语义特征表示以及第二语义特征表示。
请参阅图4,图4为本申请一个实施例提供的基于方面类别的语句情感分析方法中S4的流程示意图,包括步骤S401~S403,具体如下:
S401:获得所述若干个样本语句的若干个方面类别组的拼接向量,以及所述若干个样本语句的词性矩阵。
所述拼接向量为同一组方面类别组的若干个特征词对应的词嵌入表示进行拼接处理的结果,在本实施例中,分析设备根据所述词嵌入表示集,将同一组方面类别组的若干个特征词对应的词嵌入表示,获得所述若干个样本语句的若干个方面类别组的拼接向量,所述拼接向量的表达式为:
Figure 787445DEST_PATH_IMAGE040
式中,
Figure 366193DEST_PATH_IMAGE041
为第i个样本语句的第k个方面类别组的拼接向量,
Figure 410373DEST_PATH_IMAGE042
为第i个样本语句的第k个方面类别组的实体词对应的词嵌入表示,
Figure 949939DEST_PATH_IMAGE043
为第i个样本语句的第k个方面类别组的属性词对应的词嵌入表示,
Figure 347553DEST_PATH_IMAGE044
为向量拼接符号。
所述词性矩阵体现了样本语句中各个单词的词性,其中,所述词性包括形容词、副词、名词和其他。考虑不同词性的词对情感表达的作用不尽相同,样本语句中形容词、副词和名词对情感分类任务贡献更大,在本实施例中,分析设备基于预设的词性,通过随机初始化,对所述样本语句的单词进行词性向量化,获得所述若干个样本语句的词性矩阵,所述词性矩阵的表达式为:
Figure 921754DEST_PATH_IMAGE045
式中,
Figure 136835DEST_PATH_IMAGE046
为第i个样本语句的词性矩阵,
Figure 429276DEST_PATH_IMAGE047
为第i个样本语句的第n个单词的词性 表示。
S402:根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第一语义特征计算算法,获得若干个样本语句的若干个方面类别组的第一语义特征表示。
所述第一语义特征计算算法为:
Figure 614269DEST_PATH_IMAGE048
式中,
Figure 308556DEST_PATH_IMAGE049
为第i个样本语句的第k个方面类别组关于第n个单词的第一融合词性表 示,
Figure 694538DEST_PATH_IMAGE050
表示截取到第pp+t个单词对应的词性表示,p+tn
Figure 319948DEST_PATH_IMAGE051
为第一卷积核参数,
Figure 449578DEST_PATH_IMAGE052
为第一可训练参数矩阵,
Figure 998371DEST_PATH_IMAGE053
为第一可训练偏置参数,
Figure 414308DEST_PATH_IMAGE054
为第二可训练参数矩阵,
Figure 415762DEST_PATH_IMAGE055
为为第 二可训练偏置参数,
Figure 349083DEST_PATH_IMAGE056
为第i个样本语句的第k个方面类别组关于第n个单词的第二融合词 性表示,
Figure 627749DEST_PATH_IMAGE057
为第i个样本语句的第k个方面类别组关于第n个单词的第一语义特征表示;
在本实施例中,分析设备根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第一语义特征计算算法,获得若干个样本语句的若干个方面类别组的第一语义特征表示。
上述计算公式,分析设备分别利用ReLUtanh激活函数作为词性信息和样本语句情感信息门函数。由于tanh激活函数范围[-1,+1],可认为提取样本语句中每个词的语义信息。而ReLU激活函数的范围[0,+∞],通过捕获样本语句中重要词性信息,给以样本语句中每个单词一个体现重要性的权重。将经过两个门机制的特征进行点乘,对样本语句中每个单词的语义信息进行缩放,捕获样本语句中重要词性的语义信息,去除噪声信息。
S403:根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第二语义特征计算算法,获得若干个样本语句的若干个方面类别组的第二语义特征表示。
所述第二语义特征计算算法为:
Figure 355534DEST_PATH_IMAGE058
式中,
Figure 578705DEST_PATH_IMAGE059
为第i个样本语句的第k个方面类别组关于第n个单词的第三融合词性表 示,
Figure 440350DEST_PATH_IMAGE060
表示截取到第pp+t个单词对应的词嵌入表示;
Figure 698156DEST_PATH_IMAGE061
为第二卷积核参数,
Figure 331263DEST_PATH_IMAGE062
为第i 个样本语句的第k个方面类别组关于第n个单词的第四融合词性表示,
Figure 681211DEST_PATH_IMAGE063
为第i个样本语句 的第k个方面类别组关于第n个单词的第二语义特征表示。
在本实施例中,分析设备根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第二语义特征计算算法,获得若干个样本语句的若干个方面类别组的第二语义特征表示。
为了提高情感分析的准确性,分析设备通过增加方面类别信息,捕获样本语句中关于方面类别的上下文语义信息,以此区别样本语句中不同方面类别的表示。
S5:将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据。
在本实施例中,分析设备将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据,其中,所述预测分布数据包括分类预测分布数据以及情感预测分布数据。
请参阅图5,图5为本申请一个实施例提供的基于方面类别的语句情感分析方法中S5的流程示意图,包括步骤S501~S502,具体如下:
S501:根据若干个样本语句的若干个方面类别组的第一语义特征表示以及预设的分类预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的分类预测分布数据。
所述分类预测分布数据计算算法为:
Figure 956334DEST_PATH_IMAGE064
式中,
Figure 68647DEST_PATH_IMAGE065
为第i个样本语句的第k个方面类别组的分类预测分布数据,
Figure 262868DEST_PATH_IMAGE066
为第i个 样本语句的第k个方面类别组的第一语义特征表示,由第i个样本语句的第k个方面类别组 的各个单词的第一语义特征表示进行拼接操作获得的;
Figure 460631DEST_PATH_IMAGE067
为第三可训练的参数矩阵,
Figure 539445DEST_PATH_IMAGE068
Figure 116051DEST_PATH_IMAGE069
为第一语义特征表示的维度,T为预设的与方面类别相关联的伪标签的数 目,
Figure 622119DEST_PATH_IMAGE070
为第三偏置参数;
Figure 307178DEST_PATH_IMAGE071
为归一化函数;
在本实施例中,分析设备根据若干个样本语句的若干个方面类别组的第一语义特征表示以及预设的分类预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的分类预测分布数据,能够进一步强化第一语义特征表示中包含目标方面类别的信息,以提高情感分析的准确性。
S502:根据若干个样本语句的若干个方面类别组的第一语义特征表示、第二语义特征表示、注意力特征表示以及预设的情感预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的情感预测分布数据。
所述情感预测分布数据计算算法为:
Figure 924104DEST_PATH_IMAGE072
式中,
Figure 135643DEST_PATH_IMAGE073
为可训练的参数矩阵,
Figure 547032DEST_PATH_IMAGE074
为第i个样本语句的第k个方面类别组的第二 语义特征表示,由第i个样本语句的第k个方面类别组的各个单词的第二语义特征表示进行 拼接操作获得的;其中,C表示情感类别,包含积极、消极以及中立,
Figure 719388DEST_PATH_IMAGE075
为第四偏置参数。
在本实施例中,分析设备根据若干个样本语句的若干个方面类别组的第一语义特征表示、第二语义特征表示、注意力特征表示以及预设的情感预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的情感预测分布数据。
S6:根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型。
在本实施例中,分析设备根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型,以提高情感分析的准确率。
请参阅图6,图6为本申请一个实施例提供的基于方面类别的语句情感分析方法中S6的流程示意图,包括步骤S601~S603,具体如下:
S601:获得所述若干个样本语句的若干个方面类别组的分类真实分布数据,根据所述若干个样本语句的若干个方面类别组的分类真实分布数据以及分类预测分布数据,构建分类损失函数。
所述分类真实分布数据用于指示方面类别组的情感分类。
在本实施例中,分析设备获得所述若干个样本语句的若干个方面类别组的分类真实分布数据,根据所述若干个样本语句的若干个方面类别组的分类真实分布数据以及分类预测分布数据,构建分类损失函数,其中,所述分类损失函数为:
Figure 239538DEST_PATH_IMAGE076
式中,
Figure 180949DEST_PATH_IMAGE077
为所述分类损失函数,m为所述样本语句的数目,K为所述样本语 句中方面类别组的数目,
Figure 887874DEST_PATH_IMAGE078
为第i个样本语句的第k个方面类别组的分类真实分布数据,
Figure 547525DEST_PATH_IMAGE079
为正则项参数,
Figure 506254DEST_PATH_IMAGE080
为所述神经网络模型的所有参数;
S602:获得所述若干个样本语句的若干个方面类别组的情感真实分布数据,根据所述若干个样本语句的若干个方面类别组的情感真实分布数据以及情感预测分布数据,构建情感损失函数。
所述情感真实分布数据用于指示方面类别组的情感类型。
在本实施例中,分析设备获得所述若干个样本语句的若干个方面类别组的情感真实分布数据,根据所述若干个样本语句的若干个方面类别组的情感真实分布数据以及情感预测分布数据,构建情感损失函数,其中,所述情感损失函数为:
Figure 177538DEST_PATH_IMAGE081
式中,
Figure 665151DEST_PATH_IMAGE082
为所述情感损失函数,
Figure 812099DEST_PATH_IMAGE083
为第i个样本语句的第k个方面类 别组的情感真实分布数据。
S603:根据所述分类损失函数以及情感损失函数,构建所述神经网络模型的损失函数。
在本实施例中,分布设备根据所述分类损失函数以及情感损失函数,构建所述神经网络模型的损失函数,其中,所述神经网络模型的损失函数为:
Figure 433573DEST_PATH_IMAGE084
式中,
Figure 926740DEST_PATH_IMAGE085
为所述神经网络模型的损失函数,
Figure 850834DEST_PATH_IMAGE086
为第一可训练损失参数,
Figure 344132DEST_PATH_IMAGE087
为 第二可训练损失参数。
S7:响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
所述情感分析指令是用户发出,分析设备接收的。
在本实施例中,分析设备获取用户发出的情感分析指令,并进行响应,响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
请参阅图7,图7为本申请一个实施例提供的基于方面类别的语句情感分析方法中S7的流程示意图,包括步骤S701~S702,具体如下:
S701:将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的关于方面类别组的情感预测分布数据。
S702:根据所述待测语句的关于方面类别组的情感预测分布数据,获得所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,将所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。
在本实施例中,分析设备将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的关于方面类别组的情感预测分布数据,根据所述待测语句的关于方面类别组的情感预测分布数据,获得所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,将所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。
具体地,所述情感极性包括积极、中性以及消极,具体地,当计算得到所述待测语句的关于方面类别组的情感预测分布数据u=[u积极,u消极,u中性]=[0.1,0.7,0.2],概率最大为u消极,其概率最大的维度对应的情感极性为消极,作为所述待测语句的情感分析结果。
请参考图8,图8为本申请一个实施例提供的基于方面类别的语句情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现基于方面类别的语句情感分析装置的全部或一部分,该装置8包括:
语句获得模块81,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;
编码模块82,用于将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;
注意力计算模块83,用于将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;
语义特征提取模块84,用于将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
分布预测模块85,用于将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;
训练模块86,用于根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;
分析模块87,用于响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
在本实施例中,通过语句获得模块,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;
通过编码模块,将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;通过注意力计算模块,将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;通过语义特征提取模块,将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;通过分布预测模块,将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;通过训练模块,根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;通过分析模块,响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。通过样本语句以及样本语句的若干个方面类别组,构建句子特征表示集、词嵌入表示集以及方面类别表示集,采用深度学习方法,对神经网络模型进行训练,提高了基于方面类别的情感分析的精准性以及效率性,从而实现对语句的情感分析的准确以及稳定分析。
请参考图9,图9为本申请一个实施例提供的计算机设备的结构示意图,计算机设备9包括:处理器91、存储器92以及存储在存储器92上并可在处理器91上运行的计算机程序93;计算机设备可以存储有多条指令,指令适用于由处理器91加载并执行上述图1至图7的方法步骤,具体执行过程可以参见图1至图7的具体说明,在此不进行赘述。
其中,处理器91可以包括一个或多个处理核心。处理器91利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器92内的指令、程序、代码集或指令集,以及调用存储器92内的数据,执行基于方面类别的语句情感分析装置9的各种功能和处理数据,可选的,处理器91可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrambleLogic Array,PLA)中的至少一个硬件形式来实现。处理器91可集成中央处理器91(CentralProcessing Unit,CPU)、图像处理器91(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器91中,单独通过一块芯片进行实现。
其中,存储器92可以包括随机存储器92(Random Access Memory,RAM),也可以包括只读存储器92(Read-Only Memory)。可选的,该存储器92包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器92可用于存储指令、程序、代码、代码集或指令集。存储器92可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器92可选的还可以是至少一个位于远离前述处理器91的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行上述图1至图7的方法步骤,具体执行过程可以参见图1至图7的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束算法。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。

Claims (9)

1.一种基于方面类别的语句情感分析方法,其特征在于,包括以下步骤:
获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词,所述特征词的类型包括实体词以及属性词;
将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句;
将所述若干个拼接处理后的样本语句输入至神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示;
将同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为句子特征表示集;
将同一个拼接处理后样本语句的若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示进行组合,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,作为词嵌入特征表示集;
将包含有同一实体词的拼接处理后的样本语句进行组合,获得若干个实体词对应的样本语句集,以及将包含有同一属性词的拼接处理后的样本语句进行组合,获得若干个属性词对应的样本语句集;
将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为方面类别特征表示集;
将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;
将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;
根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;
响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
2.根据权利要求1所述的基于方面类别的语句情感分析方法,其特征在于,所述将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示,包括步骤:
构建与所述样本语句相应的特征词相关联的图网络结构,其中,所述图网络包括中心节点以及若干个子节点;
将所述特征词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将同一特征词对应的样本语句的方面类别特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的邻接矩阵;
根据所述若干个特征词对应的样本语句的方面类别特征表示、相应的特征词对应的邻接矩阵以及所述图注意力网络模块的图注意力计算算法,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的注意力特征表示,其中,所述特征词对应的注意力特征表示包括实体词对应的注意力特征表示,以及属性词对应的注意力特征表示,所述图注意力计算算法为:
Figure 355037DEST_PATH_IMAGE001
式中,
Figure 706384DEST_PATH_IMAGE002
为所述图注意力网络模块的第l层的特征词对应的注意力特征表示,ReLU() 为激活函数,q为所述图网络结构的子节点的数目,
Figure 652343DEST_PATH_IMAGE003
为所述图注意力网络模块的第l层的 权重参数,
Figure 63733DEST_PATH_IMAGE004
为所述图注意力网络模块的第l层的可训练的位置关系矩阵,
Figure 845876DEST_PATH_IMAGE005
为所述 图注意力网络模块的第l层的方面类别特征表示,
Figure 735334DEST_PATH_IMAGE006
为所述图注意力网络模块的第l层的 偏置参数,
Figure 801379DEST_PATH_IMAGE007
为第j个样本语句的第k个方面类别组的邻接矩阵中节点之间关系,
Figure 383670DEST_PATH_IMAGE008
为所 述图注意力网络模块的参数矩阵,
Figure 777742DEST_PATH_IMAGE009
为所述图注意力网络模块的第l-1层的特征词对应 的词嵌入表示;
根据所述同一个方面类别组的实体词对应的注意力特征表示、所述属性词对应的注意力特征表示以及预设的特征融合算法,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示,其中,所述特征融合算法为:
Figure 847723DEST_PATH_IMAGE010
式中,
Figure 909220DEST_PATH_IMAGE011
为第i个样本语句中的第k个方面类别组对应的注意力特征表示,
Figure 521467DEST_PATH_IMAGE012
为 所述图注意力网络模块的第l层的实体词对应的注意力特征表示,
Figure 402835DEST_PATH_IMAGE013
为所述图注 意力网络模块的第l层的属性词对应的注意力特征表示,
Figure 775042DEST_PATH_IMAGE014
为预设的第一可训练权重参数,
Figure 425466DEST_PATH_IMAGE015
为预设的第二可训练权重参数。
3.根据权利要求1所述的基于方面类别的语句情感分析方法,其特征在于:所述语义特征表示包括第一语义特征表示以及第二语义特征表示;
所述将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示,包括步骤:
获得所述若干个样本语句的若干个方面类别组的拼接向量,以及所述若干个样本语句的词性矩阵,其中,所述拼接向量为同一组方面类别组的若干个特征词对应的词嵌入表示进行拼接处理的结果;
根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第一语义特征计算算法,获得若干个样本语句的若干个方面类别组的第一语义特征表示,其中,所述第一语义特征计算算法为:
Figure 474193DEST_PATH_IMAGE016
式中,
Figure 108437DEST_PATH_IMAGE017
为第i个样本语句的第k个方面类别组关于第n个单词的第一融合词性表示,
Figure 143389DEST_PATH_IMAGE018
表示截取到第pp+t个单词对应的词性表示,p+tn
Figure 22221DEST_PATH_IMAGE019
为第一卷积核参数,
Figure 382795DEST_PATH_IMAGE020
为第i个样本语句的第k个方面类别组的拼接向量,
Figure 363390DEST_PATH_IMAGE021
为第一可训练参 数矩阵,
Figure 936454DEST_PATH_IMAGE022
为第一可训练偏置参数,
Figure 827049DEST_PATH_IMAGE023
为第二可训练参数矩阵,
Figure 233891DEST_PATH_IMAGE024
为为第二可训练偏置参 数,
Figure 311568DEST_PATH_IMAGE025
为第i个样本语句的第k个方面类别组关于第n个单词的第二融合词性表示,
Figure 219481DEST_PATH_IMAGE026
为第i个样本语句的第k个方面类别组关于第n个单词的第一语义特征表示;
根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第二语义特征计算算法,获得若干个样本语句的若干个方面类别组的第二语义特征表示,其中,所述第二语义特征计算算法为:
Figure 823638DEST_PATH_IMAGE027
式中,
Figure 526015DEST_PATH_IMAGE028
为第i个样本语句的第k个方面类别组关于第n个单词的第三融合词性表示,
Figure 467820DEST_PATH_IMAGE029
表示截取到第pp+t个单词对应的词嵌入表示;
Figure 648265DEST_PATH_IMAGE030
为第二卷积核参数,
Figure 247874DEST_PATH_IMAGE031
为第i个 样本语句的第k个方面类别组关于第n个单词的第四融合词性表示,
Figure 245786DEST_PATH_IMAGE032
为第i个样本语句的 第k个方面类别组关于第n个单词的第二语义特征表示。
4.根据权利要求3所述的基于方面类别的语句情感分析方法,其特征在于:所述预测分布数据包括分类预测分布数据以及情感预测分布数据;
所述将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据,包括步骤:
根据若干个样本语句的若干个方面类别组的第一语义特征表示以及预设的分类预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的分类预测分布数据,其中,所述分类预测分布数据计算算法为:
Figure 298055DEST_PATH_IMAGE033
式中,
Figure 282192DEST_PATH_IMAGE034
为第i个样本语句的第k个方面类别组的分类预测分布数据,
Figure 877252DEST_PATH_IMAGE035
为第i个样本 语句的第k个方面类别组的第一语义特征表示,由第i个样本语句的第k个方面类别组的各 个单词的第一语义特征表示进行拼接操作获得的;
Figure 655852DEST_PATH_IMAGE036
为第三可训练的参数矩阵,
Figure 460997DEST_PATH_IMAGE037
Figure 107879DEST_PATH_IMAGE038
为第一语义特征表示的维度,T为预设的与方面类别相关联的伪标签的数 目,
Figure 682080DEST_PATH_IMAGE039
为第三偏置参数;
Figure 5483DEST_PATH_IMAGE040
为归一化函数;
根据若干个样本语句的若干个方面类别组的第一语义特征表示、第二语义特征表示、注意力特征表示以及预设的情感预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的情感预测分布数据,其中,所述情感预测分布数据计算算法为:
Figure 32345DEST_PATH_IMAGE041
式中,
Figure 358284DEST_PATH_IMAGE042
为第i个样本语句的第k个方面类别组的情感预测分布数据,
Figure 911625DEST_PATH_IMAGE043
为第i个样本 语句中的第k个方面类别组对应的注意力特征表示,
Figure 32028DEST_PATH_IMAGE044
为可训练的参数矩阵,
Figure 811765DEST_PATH_IMAGE045
为第i个 样本语句的第k个方面类别组的第二语义特征表示,由第i个样本语句的第k个方面类别组 的各个单词的第二语义特征表示进行拼接操作获得的;其中,C表示情感类别,包含积极、消 极以及中立,
Figure 551182DEST_PATH_IMAGE046
为第四偏置参数。
5.根据权利要求4所述的基于方面类别的语句情感分析方法,其特征在于,所述根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,包括步骤:
获得所述若干个样本语句的若干个方面类别组的分类真实分布数据,根据所述若干个样本语句的若干个方面类别组的分类真实分布数据以及分类预测分布数据,构建分类损失函数,其中,所述分类损失函数为:
Figure 834396DEST_PATH_IMAGE047
式中,
Figure 515913DEST_PATH_IMAGE048
为所述分类损失函数,m为所述样本语句的数目,K为所述样本语句中 方面类别组的数目,
Figure 517367DEST_PATH_IMAGE049
为第i个样本语句的第k个方面类别组的分类真实分布数据,
Figure 185109DEST_PATH_IMAGE050
为正 则项参数,
Figure 699660DEST_PATH_IMAGE051
为所述神经网络模型的所有参数;
获得所述若干个样本语句的若干个方面类别组的情感真实分布数据,根据所述若干个样本语句的若干个方面类别组的情感真实分布数据以及情感预测分布数据,构建情感损失函数,其中,所述情感损失函数为:
Figure 693024DEST_PATH_IMAGE052
式中,
Figure 650616DEST_PATH_IMAGE053
为所述情感损失函数,
Figure 512261DEST_PATH_IMAGE054
为第i个样本语句的第k个方面类别组的 情感真实分布数据;
根据所述分类损失函数以及情感损失函数,构建所述神经网络模型的损失函数,其中,所述神经网络模型的损失函数为:
Figure 504488DEST_PATH_IMAGE055
式中,
Figure 403174DEST_PATH_IMAGE056
为所述神经网络模型的损失函数,
Figure 989007DEST_PATH_IMAGE057
为第一可训练损失参数,
Figure 264131DEST_PATH_IMAGE058
为第二 可训练损失参数。
6.根据权利要求5所述的基于方面类别的语句情感分析方法,其特征在于,所述将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果,包括步骤:
将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的关于方面类别组的情感预测分布数据;
根据所述待测语句的关于方面类别组的情感预测分布数据,获得所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,将所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。
7.一种基于方面类别的语句情感分析装置,其特征在于,包括:
语句获得模块,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词,所述特征词的类型包括实体词以及属性词;
编码模块,用于将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句;
将所述若干个拼接处理后的样本语句输入至神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示;
将同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为句子特征表示集;
将同一个拼接处理后样本语句的若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示进行组合,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,作为词嵌入特征表示集;
将包含有同一实体词的拼接处理后的样本语句进行组合,获得若干个实体词对应的样本语句集,以及将包含有同一属性词的拼接处理后的样本语句进行组合,获得若干个属性词对应的样本语句集;
将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为方面类别特征表示集;
注意力计算模块,用于将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;
语义特征提取模块,用于将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
分布预测模块,用于将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;
训练模块,用于根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;
分析模块,用于响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
8.一种计算机设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的基于方面类别的语句情感分析方法的步骤。
9.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的基于方面类别的语句情感分析方法的步骤。
CN202211047550.XA 2022-08-30 2022-08-30 基于方面类别的语句情感分析方法、装置以及设备 Active CN115168592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211047550.XA CN115168592B (zh) 2022-08-30 2022-08-30 基于方面类别的语句情感分析方法、装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211047550.XA CN115168592B (zh) 2022-08-30 2022-08-30 基于方面类别的语句情感分析方法、装置以及设备

Publications (2)

Publication Number Publication Date
CN115168592A CN115168592A (zh) 2022-10-11
CN115168592B true CN115168592B (zh) 2022-12-27

Family

ID=83481608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211047550.XA Active CN115168592B (zh) 2022-08-30 2022-08-30 基于方面类别的语句情感分析方法、装置以及设备

Country Status (1)

Country Link
CN (1) CN115168592B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115906863B (zh) * 2022-10-25 2023-09-12 华南师范大学 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115712726B (zh) * 2022-11-08 2023-09-12 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112446202A (zh) * 2019-08-16 2021-03-05 阿里巴巴集团控股有限公司 文本的分析方法和装置
CN113535904A (zh) * 2021-07-23 2021-10-22 重庆邮电大学 一种基于图神经网络的方面级情感分析方法
CN113743097A (zh) * 2021-08-23 2021-12-03 桂林电子科技大学 基于跨度共享和语法依存关系增强的情感三元组抽取方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10050926B2 (en) * 2014-02-05 2018-08-14 Facebook, Inc. Ideograms based on sentiment analysis
US11868730B2 (en) * 2020-09-23 2024-01-09 Jingdong Digits Technology Holding Co., Ltd. Method and system for aspect-level sentiment classification by graph diffusion transformer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112446202A (zh) * 2019-08-16 2021-03-05 阿里巴巴集团控股有限公司 文本的分析方法和装置
CN113535904A (zh) * 2021-07-23 2021-10-22 重庆邮电大学 一种基于图神经网络的方面级情感分析方法
CN113743097A (zh) * 2021-08-23 2021-12-03 桂林电子科技大学 基于跨度共享和语法依存关系增强的情感三元组抽取方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Aspect-Based Sentiment Analysis Using Graph Convolutional Networks and Co-attention Mechanism;Zhaowei Chen等;《Spring Nature Switzerland AG 2021》;20211231;441-448 *
Modeling Inter-aspect Relationship with Conjunciton forAspect-Based Sentiment Analysis;Haoliang Zhao;《Spring Nature Switzerland AG 2021》;20211231;756-767 *
Relational Graph Attention Network for Aspect-based Sentiment Analysis;Kai Wang等;《arXiv.org》;20200430;1-10 *

Also Published As

Publication number Publication date
CN115168592A (zh) 2022-10-11

Similar Documents

Publication Publication Date Title
CN114676704B (zh) 句子情感分析方法、装置、设备以及存储介质
CN115168592B (zh) 基于方面类别的语句情感分析方法、装置以及设备
CN110781273B (zh) 文本数据处理方法、装置、电子设备及存储介质
CN116402063B (zh) 多模态讽刺识别方法、装置、设备以及存储介质
CN111581966A (zh) 一种融合上下文特征方面级情感分类方法和装置
CN113704460B (zh) 一种文本分类方法、装置、电子设备和存储介质
CN116089619B (zh) 情感分类方法、装置、设备以及存储介质
CN115587597B (zh) 基于子句级关系图的方面词的情感分析方法以及装置
CN115438215A (zh) 图文双向搜索及匹配模型训练方法、装置、设备及介质
CN113095072B (zh) 文本处理方法及装置
CN115906861B (zh) 基于交互方面信息融合的语句情感分析方法以及装置
CN115659987B (zh) 基于双通道的多模态命名实体识别方法、装置以及设备
CN117407523A (zh) 句子情感分析方法、装置、计算机设备以及存储介质
CN115906863B (zh) 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115905518B (zh) 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN115827878B (zh) 语句情感分析方法、装置以及设备
CN114547312B (zh) 基于常识知识图谱的情感分析方法、装置以及设备
CN115905524A (zh) 融合句法和语义信息的情感分析方法、装置以及设备
CN115033700A (zh) 基于相互学习网络的跨领域情感分析方法、装置以及设备
CN116029294B (zh) 词项配对方法、装置及设备
CN118035454B (zh) 表情包分类识别方法、装置、计算机设备以及存储介质
CN117034943B (zh) 论证提取以及关系识别方法、装置、设备以及存储介质
CN114330339B (zh) 文本处理方法、计算机可读存储介质及计算机设备
CN115712726B (zh) 基于双词嵌入的情感分析方法、装置以及设备
CN118246445A (zh) 基于情感词性图卷积网络的方面级情感分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant