CN115168592A - 基于方面类别的语句情感分析方法、装置以及设备 - Google Patents

基于方面类别的语句情感分析方法、装置以及设备 Download PDF

Info

Publication number
CN115168592A
CN115168592A CN202211047550.XA CN202211047550A CN115168592A CN 115168592 A CN115168592 A CN 115168592A CN 202211047550 A CN202211047550 A CN 202211047550A CN 115168592 A CN115168592 A CN 115168592A
Authority
CN
China
Prior art keywords
sample
sentence
feature
representation
aspect category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211047550.XA
Other languages
English (en)
Other versions
CN115168592B (zh
Inventor
肖峻阳
赵浩梁
薛云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202211047550.XA priority Critical patent/CN115168592B/zh
Publication of CN115168592A publication Critical patent/CN115168592A/zh
Application granted granted Critical
Publication of CN115168592B publication Critical patent/CN115168592B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及情感分析领域,特别涉及一种基于方面类别的语句情感分析方法、装置、设备以及存储介质。通过样本语句以及样本语句的若干个方面类别组,构建句子特征表示集、词嵌入表示集以及方面类别表示集,采用深度学习方法,对神经网络模型进行训练,提高了基于方面类别的情感分析的精准性以及效率性,从而实现对语句的情感分析的准确以及稳定分析。

Description

基于方面类别的语句情感分析方法、装置以及设备
技术领域
本发明涉及情感分析领域,特别涉及是一种基于方面类别的语句情感分析方法、装置、设备以及存储介质。
背景技术
相比粗粒度情感分类,基于方面级的情感分析是一种细粒度的情感分类任务,识别句子中给定方面的情感极性。根据给定方面的不同,分为两个子任务:方面类别情感分析和方面术语情感分析。其中方面类别情感分析任务旨在识别句子给定方面类别的情感极性。
然而,方面类别情感分析所讨论的方面类别是预定义的类别,通常不会出现在句子中,导致目前基于位置向量和句法距离等信息的方法都无法准确构建方面类别和情感观点表达的联系,从而无法对语句进行准确的情感分析。
发明内容
基于此,本发明的目的在于,提供一种基于方面类别的语句情感分析方法、装置、设备以及存储介质,通过样本语句以及样本语句的若干个方面类别组,构建句子特征表示集、词嵌入表示集以及方面类别表示集,采用深度学习方法,对神经网络模型进行训练,提高了基于方面类别的情感分析的精准性以及效率性,从而实现对语句的情感分析的准确以及稳定分析。
第一方面,本申请实施例提供了一种基于方面类别的语句情感分析方法,包括以下步骤:
获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;
将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;
将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;
将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;
根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;
响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
第二方面,本申请实施例提供了一种基于方面类别的语句情感分析装置,包括:
语句获得模块,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;
编码模块,用于将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;
注意力计算模块,用于将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;
语义特征提取模块,用于将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
分布预测模块,用于将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;
训练模块,用于根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;
分析模块,用于响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述基于方面类别的语句情感分析方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于方面类别的语句情感分析方法的步骤。
在本申请实施例中,提供一种基于方面类别的语句情感分析方法、装置、设备以及存储介质,通过样本语句以及样本语句的若干个方面类别组,构建句子特征表示集、词嵌入表示集以及方面类别表示集,采用深度学习方法,对神经网络模型进行训练,提高了基于方面类别的情感分析的精准性以及效率性,从而实现对语句的情感分析的准确以及稳定分析。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请一个实施例提供的基于方面类别的语句情感分析方法的流程示意图;
图2为本申请一个实施例提供的基于方面类别的语句情感分析方法中S2的流程示意图;
图3为本申请一个实施例提供的基于方面类别的语句情感分析方法中S3的流程示意图;
图4为本申请一个实施例提供的基于方面类别的语句情感分析方法中S4的流程示意图;
图5为本申请一个实施例提供的基于方面类别的语句情感分析方法中S5的流程示意图;
图6为本申请一个实施例提供的基于方面类别的语句情感分析方法中S6的流程示意图;
图7为本申请一个实施例提供的基于方面类别的语句情感分析方法中S7的流程示意图;
图8为本申请一个实施例提供的基于方面类别的语句情感分析装置的结构示意图;
图9为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请一个实施例提供的基于方面类别的语句情感分析方法的流程示意图,所述方法包括如下步骤:
S1:获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词。
所述基于方面类别的语句情感分析方法的执行主体为基于方面类别的语句情感分析方法的分析设备(以下简称分析设备),在一个可选的实施例中,所述分析设备可以是一台计算机设备可以是服务器,或是多台计算机设备联合而成的服务器机群。
所述样本语句包括若干个单词,所述单词可以是名词、形容词等等。
在本实施例中,分析设备可以获得用户输入的若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述样本语句的若干个方面类别组,所述方面类别组包括若干个特征词,所述特征词体现了所述样本语句中的方面类别。
S2:将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集。
所述编码模块可以采用BERT(Bidirectional Encoder Representation fromTransformers)模型,也可以采用GloVe模型,用于对样本语句以及方面类别组的进行词嵌入处理。
在本实施例中,分析模块将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示。
所述特征词包括实体词以及属性词,在一个可选的实施例中,一组方面类别组由一个实体词以及属性词组成。请参阅图2,图2为本申请一个实施例提供的基于方面类别的语句情感分析方法中S2的流程示意图,包括步骤S201~S206,具体如下:
S201:将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句。
在本实施例中,分析设备将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句,例如,当该样本语句有相应的一个方面类别组,该方面类别组由一个实体词以及属性词组成,拼接处理后的样本语句的表达式为:
Figure 329903DEST_PATH_IMAGE001
式中,
Figure 555348DEST_PATH_IMAGE002
为样本语句的句子表示,
Figure DEST_PATH_IMAGE003
为实体词的词表示,
Figure 144592DEST_PATH_IMAGE004
为属性词的词表示,[CLS]以及[SEP]均为拼接处理中,关于BERT词嵌入模型的标记符号。
S202:将所述若干个拼接处理后的样本语句输入至所述神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示。
在本实施例中,分析设备将所述若干个拼接处理后的样本语句输入至所述神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示。
S203:将同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为所述句子特征表示集。
在本实施例中,分析设备将同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为所述句子特征表示集。其中,所述若干个样本语句的句子特征表示的表达式为:
Figure DEST_PATH_IMAGE005
式中,
Figure 891706DEST_PATH_IMAGE006
表示第i个样本句子的词嵌入矩阵,
Figure DEST_PATH_IMAGE007
为第i个样本语句的第n个单词对应的词嵌入表示。
S204:将同一个拼接处理后样本语句的若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示进行组合,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,作为所述词嵌入特征表示集。
Figure 224598DEST_PATH_IMAGE008
式中,
Figure DEST_PATH_IMAGE009
表示第i个样本语句的第k个方面类别组的词嵌入矩阵,
Figure 711074DEST_PATH_IMAGE010
为第i个样本语句的第k个方面类别组的实体词对应的词嵌入表示,
Figure DEST_PATH_IMAGE011
为第i个样本语句的第k个方面类别组的属性词对应的词嵌入表示。
S205:将包含有同一实体词的拼接处理后的样本语句进行组合,获得若干个实体词对应的样本语句集,以及将包含有同一属性词的拼接处理后的样本语句进行组合,获得所述若干个属性词对应的样本语句集。
在本实施例中,分析设备将包含有同一实体词的拼接处理后的样本语句进行组合,获得若干个实体词对应的样本语句集,以及将包含有所述同一属性词的拼接处理后的样本语句进行组合,获得若干个属性词对应的样本语句集,所述实体词对应的样本语句集的表达式为:
Figure 940061DEST_PATH_IMAGE012
式中,
Figure DEST_PATH_IMAGE013
为第i个样本语句中的第k个方面类别组的实体词对应的样本语句集,
Figure 637454DEST_PATH_IMAGE014
为该实体词对应的样本语句集中的第j个样本语句的句子表示。
所述属性词对应的样本语句集的表达式为:
Figure DEST_PATH_IMAGE015
式中,
Figure 508458DEST_PATH_IMAGE016
为第i个样本语句中的第k个方面类别组的属性词对应的样本语句集,
Figure DEST_PATH_IMAGE017
为该属性词对应的样本语句集中的第j个样本语句的句子表示。
S206:将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为所述方面类别特征表示集。
在本实施例中,分析设备将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为所述方面类别特征表示集。
具体地,分析设备将所述实体词对应的样本语句集中的样本语句的句子表示进行拼接处理,获得所述实体词对应的样本语句集对应的总句子表示,所述实体词对应的样本语句集对应的总句子表示的表达式为:
Figure 380599DEST_PATH_IMAGE018
将所述实体词对应的样本语句集对应的总句子表示输入至所述神经网络模型中的编码模块,取BERT词嵌入模型的第j个样本语句前的拼接标记[CLS]对应的输出表示作为所述实体词对应的样本语句集中第j个样本语句的方面类别特征表示,如下所述:
Figure DEST_PATH_IMAGE019
式中,
Figure 577225DEST_PATH_IMAGE020
为第i个样本语句中的第k个方面类别组的实体词对应的样本语句集的关于样本语句的方面类别特征表示集,
Figure DEST_PATH_IMAGE021
为该实体词对应的样本语句集中的第j个样本语句的方面类别特征表示。
同理,分析设备将所述属性词对应的样本语句集中的样本语句的句子表示进行拼接处理,获得所述属性词对应的样本语句集对应的总句子表示,将所述属性词对应的样本语句集对应的总句子表示输入至所述神经网络模型中的编码模块,获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为所述方面类别特征表示集,具体如下:
Figure 331554DEST_PATH_IMAGE022
式中,
Figure DEST_PATH_IMAGE023
为第i个样本语句中的第k个方面类别组中的属性词对应的样本语句集的关于样本语句的方面类别特征表示集,
Figure 770364DEST_PATH_IMAGE024
为该属性词对应的样本语句集中的第j个样本语句的方面类别特征表示。
S3:将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
在本实施例中,分析设备将所述词嵌入表示集以及方面类别特征表示集,输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
请参阅图3,图3为本申请一个实施例提供的基于方面类别的语句情感分析方法中S3的流程示意图,包括步骤S301~S304,具体如下:
S301:构建与所述样本语句相应的特征词相关联的图网络结构。
为了提取特征词体现的情感信息,在本实施例中,分析设备构建与所述样本语句相应的特征词相关联的图网络结构,其中,所述样本所述图网络包括中心节点以及若干个子节点。
S302:将所述特征词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将同一特征词对应的样本语句的方面类别特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的邻接矩阵。
在本实施例中,分析设备将所述特征词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将同一特征词对应的样本语句的方面类别特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的邻接矩阵。
在一个可选的实施例中,当一组方面类别组由一个实体词以及一个属性词组成,所述方面类别组的邻接矩阵包括实体词对应的邻接矩阵以及属性词对应的邻接矩阵,具体地,分析设备分别将所述实体词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将所述同一实体词对应的样本语句的句子特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的实体词对应的邻接矩阵,同理,分析设备构建所述若干个样本语句的若干个方面类别组的属性词对应的邻接矩阵。
S303:根据所述若干个特征词对应的样本语句的方面类别特征表示、相应的特征词对应的邻接矩阵以及所述图注意力网络模块的图注意力计算算法,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的注意力特征表示。
在本实施例中,分析设备根据所述若干个特征词对应的样本语句的方面类别特征表示、相应的特征词对应的邻接矩阵以及所述图注意力网络模块的图注意力计算算法,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的注意力特征表示,所述图注意力计算算法为:
Figure DEST_PATH_IMAGE025
式中,
Figure 231432DEST_PATH_IMAGE026
为所述图注意力网络模块的第l层的特征词对应的注意力特征表示,ReLU()为激活函数,q为所述图网络结构的子节点的数目,
Figure DEST_PATH_IMAGE027
为所述图注意力网络模块的第l层的权重参数,
Figure 802222DEST_PATH_IMAGE028
为所述图注意力网络模块的第l层的可训练的位置关系矩阵,
Figure DEST_PATH_IMAGE029
为所述图注意力网络模块的第l层的方面类别特征表示,
Figure 981530DEST_PATH_IMAGE030
为所述图注意力网络模块的第l层的偏置参数,
Figure DEST_PATH_IMAGE031
为第j个样本语句的第k个方面类别组的邻接矩阵中节点之间关系,
Figure 224030DEST_PATH_IMAGE032
为所述图注意力网络模块的参数矩阵,
Figure DEST_PATH_IMAGE033
为所述图注意力网络模块的第l-1层的特征词对应的词嵌入表示;
其中,所述特征词对应的注意力特征表示包括所述实体词对应的注意力特征表示,以及所述属性词对应的注意力特征表示。
S304:根据所述同一个方面类别组的实体词对应的注意力特征表示、所述属性词对应的注意力特征表示以及预设的特征融合算法,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
所述特征融合算法为:
Figure 867501DEST_PATH_IMAGE034
式中,
Figure DEST_PATH_IMAGE035
为第i个样本语句中的第k个方面类别组对应的注意力特征表示,
Figure 671509DEST_PATH_IMAGE036
为所述图注意力网络模块的第l层的实体词对应的注意力特征表示,
Figure DEST_PATH_IMAGE037
为所述图注意力网络模块的第l层的属性词对应的注意力特征表示,
Figure 275797DEST_PATH_IMAGE038
为预设的第一可训练权重参数,
Figure DEST_PATH_IMAGE039
为预设的第二可训练权重参数。
在本实施例中,分析设备根据所述同一个方面类别组的实体词对应的注意力特征表示、所述属性词对应的注意力特征表示以及预设的特征融合算法,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示。
S4:将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示。
为了提高情感分析的准确性,在本实施例中,分析设备将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示,其中,所述语义特征表示包括第一语义特征表示以及第二语义特征表示。
请参阅图4,图4为本申请一个实施例提供的基于方面类别的语句情感分析方法中S4的流程示意图,包括步骤S401~S403,具体如下:
S401:获得所述若干个样本语句的若干个方面类别组的拼接向量,以及所述若干个样本语句的词性矩阵。
所述拼接向量为同一组方面类别组的若干个特征词对应的词嵌入表示进行拼接处理的结果,在本实施例中,分析设备根据所述词嵌入表示集,将同一组方面类别组的若干个特征词对应的词嵌入表示,获得所述若干个样本语句的若干个方面类别组的拼接向量,所述拼接向量的表达式为:
Figure 557874DEST_PATH_IMAGE040
式中,
Figure DEST_PATH_IMAGE041
为第i个样本语句的第k个方面类别组的拼接向量,
Figure 492070DEST_PATH_IMAGE042
为第i个样本语句的第k个方面类别组的实体词对应的词嵌入表示,
Figure DEST_PATH_IMAGE043
为第i个样本语句的第k个方面类别组的属性词对应的词嵌入表示,
Figure 201400DEST_PATH_IMAGE044
为向量拼接符号。
所述词性矩阵体现了样本语句中各个单词的词性,其中,所述词性包括形容词、副词、名词和其他。考虑不同词性的词对情感表达的作用不尽相同,样本语句中形容词、副词和名词对情感分类任务贡献更大,在本实施例中,分析设备基于预设的词性,通过随机初始化,对所述样本语句的单词进行词性向量化,获得所述若干个样本语句的词性矩阵,所述词性矩阵的表达式为:
Figure DEST_PATH_IMAGE045
式中,
Figure 683197DEST_PATH_IMAGE046
为第i个样本语句的词性矩阵,
Figure DEST_PATH_IMAGE047
为第i个样本语句的第n个单词的词性表示。
S402:根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第一语义特征计算算法,获得若干个样本语句的若干个方面类别组的第一语义特征表示。
所述第一语义特征计算算法为:
Figure 768964DEST_PATH_IMAGE048
式中,
Figure DEST_PATH_IMAGE049
为第i个样本语句的第k个方面类别组关于第n个单词的第一融合词性表示,
Figure 262394DEST_PATH_IMAGE050
表示截取到第pp+t个单词对应的词性表示,p+tn
Figure DEST_PATH_IMAGE051
为第一卷积核参数,
Figure 381440DEST_PATH_IMAGE052
为第一可训练参数矩阵,
Figure DEST_PATH_IMAGE053
为第一可训练偏置参数,
Figure 22637DEST_PATH_IMAGE054
为第二可训练参数矩阵,
Figure DEST_PATH_IMAGE055
为为第二可训练偏置参数,
Figure 974413DEST_PATH_IMAGE056
为第i个样本语句的第k个方面类别组关于第n个单词的第二融合词性表示,
Figure 100002_DEST_PATH_IMAGE057
为第i个样本语句的第k个方面类别组关于第n个单词的第一语义特征表示;
在本实施例中,分析设备根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第一语义特征计算算法,获得若干个样本语句的若干个方面类别组的第一语义特征表示。
上述计算公式,分析设备分别利用ReLUtanh激活函数作为词性信息和样本语句情感信息门函数。由于tanh激活函数范围[-1,+1],可认为提取样本语句中每个词的语义信息。而ReLU激活函数的范围[0,+∞],通过捕获样本语句中重要词性信息,给以样本语句中每个单词一个体现重要性的权重。将经过两个门机制的特征进行点乘,对样本语句中每个单词的语义信息进行缩放,捕获样本语句中重要词性的语义信息,去除噪声信息。
S403:根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第二语义特征计算算法,获得若干个样本语句的若干个方面类别组的第二语义特征表示。
所述第二语义特征计算算法为:
Figure 384665DEST_PATH_IMAGE058
式中,
Figure 904640DEST_PATH_IMAGE059
为第i个样本语句的第k个方面类别组关于第n个单词的第三融合词性表示,
Figure 564291DEST_PATH_IMAGE060
表示截取到第pp+t个单词对应的词嵌入表示;
Figure 319757DEST_PATH_IMAGE061
为第二卷积核参数,
Figure 551893DEST_PATH_IMAGE062
为第i个样本语句的第k个方面类别组关于第n个单词的第四融合词性表示,
Figure 632982DEST_PATH_IMAGE063
为第i个样本语句的第k个方面类别组关于第n个单词的第二语义特征表示。
在本实施例中,分析设备根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第二语义特征计算算法,获得若干个样本语句的若干个方面类别组的第二语义特征表示。
为了提高情感分析的准确性,分析设备通过增加方面类别信息,捕获样本语句中关于方面类别的上下文语义信息,以此区别样本语句中不同方面类别的表示。
S5:将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据。
在本实施例中,分析设备将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据,其中,所述预测分布数据包括分类预测分布数据以及情感预测分布数据。
请参阅图5,图5为本申请一个实施例提供的基于方面类别的语句情感分析方法中S5的流程示意图,包括步骤S501~S502,具体如下:
S501:根据若干个样本语句的若干个方面类别组的第一语义特征表示以及预设的分类预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的分类预测分布数据。
所述分类预测分布数据计算算法为:
Figure 186454DEST_PATH_IMAGE064
式中,
Figure 745611DEST_PATH_IMAGE065
为第i个样本语句的第k个方面类别组的分类预测分布数据,
Figure 333719DEST_PATH_IMAGE066
为第i个样本语句的第k个方面类别组的第一语义特征表示,由第i个样本语句的第k个方面类别组的各个单词的第一语义特征表示进行拼接操作获得的;
Figure 320129DEST_PATH_IMAGE067
为第三可训练的参数矩阵,
Figure 954373DEST_PATH_IMAGE068
Figure 927008DEST_PATH_IMAGE069
为第一语义特征表示的维度,T为预设的与方面类别相关联的伪标签的数目,
Figure 494256DEST_PATH_IMAGE070
为第三偏置参数;
Figure 25469DEST_PATH_IMAGE071
为归一化函数;
在本实施例中,分析设备根据若干个样本语句的若干个方面类别组的第一语义特征表示以及预设的分类预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的分类预测分布数据,能够进一步强化第一语义特征表示中包含目标方面类别的信息,以提高情感分析的准确性。
S502:根据若干个样本语句的若干个方面类别组的第一语义特征表示、第二语义特征表示、注意力特征表示以及预设的情感预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的情感预测分布数据。
所述情感预测分布数据计算算法为:
Figure 678167DEST_PATH_IMAGE072
式中,
Figure 720073DEST_PATH_IMAGE073
为可训练的参数矩阵,
Figure 407406DEST_PATH_IMAGE074
Figure 938881DEST_PATH_IMAGE075
为第i个样本语句的第k个方面类别组的第二语义特征表示,由第i个样本语句的第k个方面类别组的各个单词的第二语义特征表示进行拼接操作获得的;其中,C表示情感类别,包含积极、消极以及中立,
Figure 954242DEST_PATH_IMAGE076
为第四偏置参数。
在本实施例中,分析设备根据若干个样本语句的若干个方面类别组的第一语义特征表示、第二语义特征表示、注意力特征表示以及预设的情感预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的情感预测分布数据。
S6:根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型。
在本实施例中,分析设备根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型,以提高情感分析的准确率。
请参阅图6,图6为本申请一个实施例提供的基于方面类别的语句情感分析方法中S6的流程示意图,包括步骤S601~S603,具体如下:
S601:获得所述若干个样本语句的若干个方面类别组的分类真实分布数据,根据所述若干个样本语句的若干个方面类别组的分类真实分布数据以及分类预测分布数据,构建分类损失函数。
所述分类真实分布数据用于指示方面类别组的情感分类。
在本实施例中,分析设备获得所述若干个样本语句的若干个方面类别组的分类真实分布数据,根据所述若干个样本语句的若干个方面类别组的分类真实分布数据以及分类预测分布数据,构建分类损失函数,其中,所述分类损失函数为:
Figure 393313DEST_PATH_IMAGE077
式中,
Figure 76099DEST_PATH_IMAGE078
为所述分类损失函数,m为所述样本语句的数目,K为所述样本语句中方面类别组的数目,
Figure 575213DEST_PATH_IMAGE079
为第i个样本语句的第k个方面类别组的分类真实分布数据,
Figure 405766DEST_PATH_IMAGE081
为正则项参数,
Figure 22430DEST_PATH_IMAGE082
为所述神经网络模型的所有参数;
S602:获得所述若干个样本语句的若干个方面类别组的情感真实分布数据,根据所述若干个样本语句的若干个方面类别组的情感真实分布数据以及情感预测分布数据,构建情感损失函数。
所述情感真实分布数据用于指示方面类别组的情感类型。
在本实施例中,分析设备获得所述若干个样本语句的若干个方面类别组的情感真实分布数据,根据所述若干个样本语句的若干个方面类别组的情感真实分布数据以及情感预测分布数据,构建情感损失函数,其中,所述情感损失函数为:
Figure 684355DEST_PATH_IMAGE083
式中,
Figure 229737DEST_PATH_IMAGE084
为所述情感损失函数,
Figure 344324DEST_PATH_IMAGE085
为第i个样本语句的第k个方面类别组的情感真实分布数据。
S603:根据所述分类损失函数以及情感损失函数,构建所述神经网络模型的损失函数。
在本实施例中,分布设备根据所述分类损失函数以及情感损失函数,构建所述神经网络模型的损失函数,其中,所述神经网络模型的损失函数为:
Figure 266143DEST_PATH_IMAGE086
式中,
Figure 985838DEST_PATH_IMAGE087
为所述神经网络模型的损失函数,
Figure 826755DEST_PATH_IMAGE088
为第一可训练损失参数,
Figure 304004DEST_PATH_IMAGE089
为第二可训练损失参数。
S7:响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
所述情感分析指令是用户发出,分析设备接收的。
在本实施例中,分析设备获取用户发出的情感分析指令,并进行响应,响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
请参阅图7,图7为本申请一个实施例提供的基于方面类别的语句情感分析方法中S7的流程示意图,包括步骤S701~S702,具体如下:
S701:将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的关于方面类别组的情感预测分布数据。
S702:根据所述待测语句的关于方面类别组的情感预测分布数据,获得所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,将所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。
在本实施例中,分析设备将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的关于方面类别组的情感预测分布数据,根据所述待测语句的关于方面类别组的情感预测分布数据,获得所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,将所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。
具体地,所述情感极性包括积极、中性以及消极,具体地,当计算得到所述待测语句的关于方面类别组的情感预测分布数据u=[u积极,u消极,u中性]=[0.1,0.7,0.2],概率最大为u消极,其概率最大的维度对应的情感极性为消极,作为所述待测语句的情感分析结果。
请参考图8,图8为本申请一个实施例提供的基于方面类别的语句情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现基于方面类别的语句情感分析装置的全部或一部分,该装置8包括:
语句获得模块81,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;
编码模块82,用于将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;
注意力计算模块83,用于将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;
语义特征提取模块84,用于将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
分布预测模块85,用于将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;
训练模块86,用于根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;
分析模块87,用于响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
在本实施例中,通过语句获得模块,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;
通过编码模块,将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;通过注意力计算模块,将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;通过语义特征提取模块,将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;通过分布预测模块,将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;通过训练模块,根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;通过分析模块,响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。通过样本语句以及样本语句的若干个方面类别组,构建句子特征表示集、词嵌入表示集以及方面类别表示集,采用深度学习方法,对神经网络模型进行训练,提高了基于方面类别的情感分析的精准性以及效率性,从而实现对语句的情感分析的准确以及稳定分析。
请参考图9,图9为本申请一个实施例提供的计算机设备的结构示意图,计算机设备9包括:处理器91、存储器92以及存储在存储器92上并可在处理器91上运行的计算机程序93;计算机设备可以存储有多条指令,指令适用于由处理器91加载并执行上述图1至图7的方法步骤,具体执行过程可以参见图1至图7的具体说明,在此不进行赘述。
其中,处理器91可以包括一个或多个处理核心。处理器91利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器92内的指令、程序、代码集或指令集,以及调用存储器92内的数据,执行基于方面类别的语句情感分析装置9的各种功能和处理数据,可选的,处理器91可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrambleLogic Array,PLA)中的至少一个硬件形式来实现。处理器91可集成中央处理器91(CentralProcessing Unit,CPU)、图像处理器91(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器91中,单独通过一块芯片进行实现。
其中,存储器92可以包括随机存储器92(Random Access Memory,RAM),也可以包括只读存储器92(Read-Only Memory)。可选的,该存储器92包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器92可用于存储指令、程序、代码、代码集或指令集。存储器92可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器92可选的还可以是至少一个位于远离前述处理器91的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行上述图1至图7的方法步骤,具体执行过程可以参见图1至图7的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束算法。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。

Claims (10)

1.一种基于方面类别的语句情感分析方法,其特征在于,包括以下步骤:
获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;
将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;
将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;
将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;
根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;
响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
2.根据权利要求1所述的基于方面类别的语句情感分析方法,其特征在于:所述特征词的类型包括实体词以及属性词;
所述将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,包括步骤:
将所述若干个样本语句以及相应的若干个方面词类别组进行拼接处理,获得若干个拼接处理后的样本语句;
将所述若干个拼接处理后的样本语句输入至所述神经网络模型中的编码模块,获得所述若干个拼接处理后的样本语句的若干个单词对应的词嵌入表示,若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示;
将同一个拼接处理后样本语句的若干个单词对应的词嵌入表示进行拼接,获得所述若干个样本语句的句子特征表示,作为所述句子特征表示集;
将同一个拼接处理后样本语句的若干个方面类别组的若干个实体词对应的词嵌入表示以及属性词对应的词嵌入表示进行组合,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,作为所述词嵌入特征表示集;
将包含有同一实体词的拼接处理后的样本语句进行组合,获得若干个实体词对应的样本语句集,以及将包含有同一属性词的拼接处理后的样本语句进行组合,获得若干个属性词对应的样本语句集;
将所述若干个实体词对应的样本语句集以及所述若干个属性词对应的样本语句集分别输入至所述神经网络模型中的编码模块,获得所述若干个实体词对应的样本语句集中若干个样本语句的方面类别特征表示,以及获得所述若干个属性词对应的样本语句集中若干个样本语句的方面类别特征表示,作为所述方面类别特征表示集。
3.根据权利要求2所述的基于方面类别的语句情感分析方法,其特征在于,所述将所述句子特征表示集以及方面类别特征表示集,输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示,包括步骤:
构建与所述样本语句相应的特征词相关联的图网络结构,其中,所述图网络包括中心节点以及若干个子节点;
将所述特征词对应的词嵌入表示设置在所述图网络结构的中心节点,并从所述方面类别特征表示集中,将同一特征词对应的样本语句的方面类别特征表示分别设置在所述图网络结构的子节点上,构建所述若干个样本语句的若干个方面类别组的邻接矩阵;
根据所述若干个特征词对应的样本语句的方面类别特征表示、相应的特征词对应的邻接矩阵以及所述图注意力网络模块的图注意力计算算法,获得所述若干个样本语句的若干个方面类别组的若干个特征词对应的注意力特征表示,其中,所述特征词对应的注意力特征表示包括所述实体词对应的注意力特征表示,以及所述属性词对应的注意力特征表示,所述图注意力计算算法为:
Figure 674693DEST_PATH_IMAGE001
式中,
Figure 838696DEST_PATH_IMAGE002
为所述图注意力网络模块的第l层的特征词对应的注意力特征表示,ReLU()为激活函数,q为所述图网络结构的子节点的数目,
Figure 124183DEST_PATH_IMAGE003
为所述图注意力网络模块的第l层的权重参数,
Figure 267720DEST_PATH_IMAGE004
为所述图注意力网络模块的第l层的可训练的位置关系矩阵,
Figure 587843DEST_PATH_IMAGE005
为所述图注意力网络模块的第l层的方面类别特征表示,
Figure 424212DEST_PATH_IMAGE006
为所述图注意力网络模块的第l层的偏置参数,
Figure 134679DEST_PATH_IMAGE007
为第j个样本语句的第k个方面类别组的邻接矩阵中节点之间关系,
Figure 206540DEST_PATH_IMAGE008
为所述图注意力网络模块的参数矩阵,
Figure 256536DEST_PATH_IMAGE009
为所述图注意力网络模块的第l-1层的特征词对应的词嵌入表示;
根据所述同一个方面类别组的实体词对应的注意力特征表示、所述属性词对应的注意力特征表示以及预设的特征融合算法,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示,其中,所述特征融合算法为:
Figure 388440DEST_PATH_IMAGE010
式中,
Figure 22421DEST_PATH_IMAGE011
为第i个样本语句中的第k个方面类别组对应的注意力特征表示,
Figure 632394DEST_PATH_IMAGE012
为所述图注意力网络模块的第l层的实体词对应的注意力特征表示,
Figure 864792DEST_PATH_IMAGE013
为所述图注意力网络模块的第l层的属性词对应的注意力特征表示,
Figure 42964DEST_PATH_IMAGE014
为预设的第一可训练权重参数,
Figure 790340DEST_PATH_IMAGE015
为预设的第二可训练权重参数。
4.根据权利要求2所述的基于方面类别的语句情感分析方法,其特征在于:所述语义特征表示包括第一语义特征表示以及第二语义特征表示;
所述将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示,包括步骤:
获得所述若干个样本语句的若干个方面类别组的拼接向量,以及所述若干个样本语句的词性矩阵,其中,所述拼接向量为同一组方面类别组的若干个特征词对应的词嵌入表示进行拼接处理的结果;
根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第一语义特征计算算法,获得若干个样本语句的若干个方面类别组的第一语义特征表示,其中,所述第一语义特征计算算法为:
Figure 813791DEST_PATH_IMAGE016
式中,
Figure 963012DEST_PATH_IMAGE017
为第i个样本语句的第k个方面类别组关于第n个单词的第一融合词性表示,
Figure 312085DEST_PATH_IMAGE018
表示截取到第pp+t个单词对应的词性表示,p+tn
Figure 281178DEST_PATH_IMAGE019
为第一卷积核参数,
Figure 436216DEST_PATH_IMAGE020
为第一可训练参数矩阵,
Figure 813846DEST_PATH_IMAGE021
为第一可训练偏置参数,
Figure 458454DEST_PATH_IMAGE022
为第二可训练参数矩阵,
Figure 790209DEST_PATH_IMAGE023
为为第二可训练偏置参数,
Figure 545675DEST_PATH_IMAGE024
为第i个样本语句的第k个方面类别组关于第n个单词的第二融合词性表示,
Figure 607172DEST_PATH_IMAGE025
为第i个样本语句的第k个方面类别组关于第n个单词的第一语义特征表示;
根据所述若干个样本语句的若干个方面类别组的拼接向量、所述若干个样本语句的词性矩阵以及预设的第二语义特征计算算法,获得若干个样本语句的若干个方面类别组的第二语义特征表示,其中,所述第二语义特征计算算法为:
Figure 298048DEST_PATH_IMAGE026
式中,
Figure 507312DEST_PATH_IMAGE027
为第i个样本语句的第k个方面类别组关于第n个单词的第三融合词性表示,
Figure 676256DEST_PATH_IMAGE028
表示截取到第pp+t个单词对应的词嵌入表示;
Figure 388997DEST_PATH_IMAGE029
为第二卷积核参数,
Figure 578670DEST_PATH_IMAGE030
为第i个样本语句的第k个方面类别组关于第n个单词的第四融合词性表示,
Figure 377694DEST_PATH_IMAGE031
为第i个样本语句的第k个方面类别组关于第n个单词的第二语义特征表示。
5.根据权利要求4所述的基于方面类别的语句情感分析方法,其特征在于:所述预测分布数据包括分类预测分布数据以及情感预测分布数据;
所述将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据,包括步骤:
根据若干个样本语句的若干个方面类别组的第一语义特征表示以及预设的分类预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的分类预测分布数据,其中,所述分类预测分布数据计算算法为:
Figure 740542DEST_PATH_IMAGE032
式中,
Figure 183156DEST_PATH_IMAGE033
为第i个样本语句的第k个方面类别组的分类预测分布数据,
Figure 340468DEST_PATH_IMAGE034
为第i个样本语句的第k个方面类别组的第一语义特征表示,由第i个样本语句的第k个方面类别组的各个单词的第一语义特征表示进行拼接操作获得的;
Figure 134111DEST_PATH_IMAGE035
为第三可训练的参数矩阵,
Figure 769492DEST_PATH_IMAGE036
Figure 332191DEST_PATH_IMAGE037
为第一语义特征表示的维度,T为预设的与方面类别相关联的伪标签的数目,
Figure 863667DEST_PATH_IMAGE038
为第三偏置参数;
Figure 3661DEST_PATH_IMAGE039
为归一化函数;
根据若干个样本语句的若干个方面类别组的第一语义特征表示、第二语义特征表示、注意力特征表示以及预设的情感预测分布数据计算算法,获得所述若干个样本语句的若干个方面类别组的情感预测分布数据,其中,所述情感预测分布数据计算算法为:
Figure 82213DEST_PATH_IMAGE040
式中,
Figure 624053DEST_PATH_IMAGE041
为可训练的参数矩阵,
Figure 998534DEST_PATH_IMAGE042
Figure 625824DEST_PATH_IMAGE043
为第i个样本语句的第k个方面类别组的第二语义特征表示,由第i个样本语句的第k个方面类别组的各个单词的第二语义特征表示进行拼接操作获得的;其中,C表示情感类别,包含积极、消极以及中立,
Figure 743953DEST_PATH_IMAGE044
为第四偏置参数。
6.根据权利要求5所述的基于方面类别的语句情感分析方法,其特征在于,所述根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,包括步骤:
获得所述若干个样本语句的若干个方面类别组的分类真实分布数据,根据所述若干个样本语句的若干个方面类别组的分类真实分布数据以及分类预测分布数据,构建分类损失函数,其中,所述分类损失函数为:
Figure 405878DEST_PATH_IMAGE045
式中,
Figure 951260DEST_PATH_IMAGE046
为所述分类损失函数,m为所述样本语句的数目,K为所述样本语句中方面类别组的数目,
Figure 65847DEST_PATH_IMAGE047
为第i个样本语句的第k个方面类别组的分类真实分布数据,
Figure 220623DEST_PATH_IMAGE049
为正则项参数,
Figure 737055DEST_PATH_IMAGE050
为所述神经网络模型的所有参数;
获得所述若干个样本语句的若干个方面类别组的情感真实分布数据,根据所述若干个样本语句的若干个方面类别组的情感真实分布数据以及情感预测分布数据,构建情感损失函数,其中,所述情感损失函数为:
Figure 453338DEST_PATH_IMAGE051
式中,
Figure 258483DEST_PATH_IMAGE052
为所述情感损失函数,
Figure 515152DEST_PATH_IMAGE053
为第i个样本语句的第k个方面类别组的情感真实分布数据;
根据所述分类损失函数以及情感损失函数,构建所述神经网络模型的损失函数,其中,所述神经网络模型的损失函数为:
Figure 886090DEST_PATH_IMAGE054
式中,
Figure 773275DEST_PATH_IMAGE055
为所述神经网络模型的损失函数,
Figure 800137DEST_PATH_IMAGE056
为第一可训练损失参数,
Figure DEST_PATH_IMAGE057
为第二可训练损失参数。
7.根据权利要求6所述的基于方面类别的语句情感分析方法,其特征在于,所述将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果,包括步骤:
将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的关于方面类别组的情感预测分布数据;
根据所述待测语句的关于方面类别组的情感预测分布数据,获得所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,将所述待测语句的关于方面类别组的概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果。
8.一种基于方面类别的语句情感分析装置,其特征在于,包括:
语句获得模块,用于获得若干个样本语句以及所述样本语句的若干个方面类别组,其中,所述方面类别组包括若干个特征词;
编码模块,用于将所述若干个样本语句以及所述样本语句的若干个方面类别组输入至预设的神经网络模型中的编码模块,获得句子特征表示集、词嵌入表示集以及方面类别表示集,其中,所述句子特征表示集包括若干个样本语句的句子特征表示,所述词嵌入表示集包括若干个样本语句的若干个方面类别组的若干个特征词对应的词嵌入表示,所述方面类别表示集包括若干个特征词对应的样本语句的方面类别特征表示;
注意力计算模块,用于将所述词嵌入表示集以及方面类别特征表示集输入至所述神经网络模型中的图注意力网络模块,获得所述若干个样本语句的若干个方面类别组对应的注意力特征表示;
语义特征提取模块,用于将所述句子特征表示集以及词嵌入表示集输入至所述神经网络模型中的门机制语义特征提取模块,获得所述若干个样本语句的若干个方面类别组的语义特征表示;
分布预测模块,用于将所述若干个样本语句的若干个方面类别组的注意力特征表示以及语义特征表示输入至神经网络模型中的分布预测模块中,获得所述若干个样本语句的若干个方面类别组的预测分布数据;
训练模块,用于根据所述若干个样本语句的若干个方面类别组的预测分布数据,构建所述神经网络模型的损失函数,并对所述神经网络模型进行优化训练,获取优化训练后的神经网络模型;
分析模块,用于响应于情感分析指令,获取待测语句,将所述待测语句输入至所述优化训练后的神经网络模型中,获得所述待测语句的情感分析结果。
9.一种计算机设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于方面类别的语句情感分析方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于方面类别的语句情感分析方法的步骤。
CN202211047550.XA 2022-08-30 2022-08-30 基于方面类别的语句情感分析方法、装置以及设备 Active CN115168592B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211047550.XA CN115168592B (zh) 2022-08-30 2022-08-30 基于方面类别的语句情感分析方法、装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211047550.XA CN115168592B (zh) 2022-08-30 2022-08-30 基于方面类别的语句情感分析方法、装置以及设备

Publications (2)

Publication Number Publication Date
CN115168592A true CN115168592A (zh) 2022-10-11
CN115168592B CN115168592B (zh) 2022-12-27

Family

ID=83481608

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211047550.XA Active CN115168592B (zh) 2022-08-30 2022-08-30 基于方面类别的语句情感分析方法、装置以及设备

Country Status (1)

Country Link
CN (1) CN115168592B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115712726A (zh) * 2022-11-08 2023-02-24 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备
CN115906863A (zh) * 2022-10-25 2023-04-04 华南师范大学 基于对比学习的情感分析方法、装置、设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150222586A1 (en) * 2014-02-05 2015-08-06 Facebook, Inc. Ideograms Based on Sentiment Analysis
CN112446202A (zh) * 2019-08-16 2021-03-05 阿里巴巴集团控股有限公司 文本的分析方法和装置
CN113535904A (zh) * 2021-07-23 2021-10-22 重庆邮电大学 一种基于图神经网络的方面级情感分析方法
CN113743097A (zh) * 2021-08-23 2021-12-03 桂林电子科技大学 基于跨度共享和语法依存关系增强的情感三元组抽取方法
US20220092267A1 (en) * 2020-09-23 2022-03-24 Jingdong Digits Technology Holding Co., Ltd. Method and system for aspect-level sentiment classification by graph diffusion transformer

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150222586A1 (en) * 2014-02-05 2015-08-06 Facebook, Inc. Ideograms Based on Sentiment Analysis
CN112446202A (zh) * 2019-08-16 2021-03-05 阿里巴巴集团控股有限公司 文本的分析方法和装置
US20220092267A1 (en) * 2020-09-23 2022-03-24 Jingdong Digits Technology Holding Co., Ltd. Method and system for aspect-level sentiment classification by graph diffusion transformer
CN113535904A (zh) * 2021-07-23 2021-10-22 重庆邮电大学 一种基于图神经网络的方面级情感分析方法
CN113743097A (zh) * 2021-08-23 2021-12-03 桂林电子科技大学 基于跨度共享和语法依存关系增强的情感三元组抽取方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HAOLIANG ZHAO: "Modeling Inter-aspect Relationship with Conjunciton forAspect-Based Sentiment Analysis", 《SPRING NATURE SWITZERLAND AG 2021》 *
KAI WANG等: "Relational Graph Attention Network for Aspect-based Sentiment Analysis", 《ARXIV.ORG》 *
ZHAOWEI CHEN等: "Aspect-Based Sentiment Analysis Using Graph Convolutional Networks and Co-attention Mechanism", 《SPRING NATURE SWITZERLAND AG 2021》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115906863A (zh) * 2022-10-25 2023-04-04 华南师范大学 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115906863B (zh) * 2022-10-25 2023-09-12 华南师范大学 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115712726A (zh) * 2022-11-08 2023-02-24 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备
CN115712726B (zh) * 2022-11-08 2023-09-12 华南师范大学 基于双词嵌入的情感分析方法、装置以及设备

Also Published As

Publication number Publication date
CN115168592B (zh) 2022-12-27

Similar Documents

Publication Publication Date Title
CN114676704B (zh) 句子情感分析方法、装置、设备以及存储介质
CN112434721B (zh) 一种基于小样本学习的图像分类方法、系统、存储介质及终端
CN115168592B (zh) 基于方面类别的语句情感分析方法、装置以及设备
CN116402063B (zh) 多模态讽刺识别方法、装置、设备以及存储介质
CN110781273B (zh) 文本数据处理方法、装置、电子设备及存储介质
CN114821605B (zh) 一种文本的处理方法、装置、设备和介质
CN113704460B (zh) 一种文本分类方法、装置、电子设备和存储介质
CN114676695B (zh) 基于情感分析的文本语句处理方法、装置以及设备
CN116089619B (zh) 情感分类方法、装置、设备以及存储介质
CN115587597B (zh) 基于子句级关系图的方面词的情感分析方法以及装置
CN115455171B (zh) 文本视频的互检索以及模型训练方法、装置、设备及介质
CN115048938A (zh) 基于语义和句法双通道的语句情感分析方法以及装置
CN115438215A (zh) 图文双向搜索及匹配模型训练方法、装置、设备及介质
CN115906861B (zh) 基于交互方面信息融合的语句情感分析方法以及装置
CN115659987B (zh) 基于双通道的多模态命名实体识别方法、装置以及设备
CN115906863B (zh) 基于对比学习的情感分析方法、装置、设备以及存储介质
CN115905518B (zh) 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN114547312B (zh) 基于常识知识图谱的情感分析方法、装置以及设备
CN116258145A (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN115827878A (zh) 语句情感分析方法、装置以及设备
CN115905524A (zh) 融合句法和语义信息的情感分析方法、装置以及设备
CN110852066A (zh) 一种基于对抗训练机制的多语言实体关系抽取方法及系统
CN114970666A (zh) 一种口语处理方法、装置、电子设备及存储介质
CN113688232A (zh) 招标文本分类方法、装置、存储介质及终端
CN118035454B (zh) 表情包分类识别方法、装置、计算机设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant