CN115905518B - 基于知识图谱的情感分类方法、装置、设备以及存储介质 - Google Patents

基于知识图谱的情感分类方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN115905518B
CN115905518B CN202211265500.9A CN202211265500A CN115905518B CN 115905518 B CN115905518 B CN 115905518B CN 202211265500 A CN202211265500 A CN 202211265500A CN 115905518 B CN115905518 B CN 115905518B
Authority
CN
China
Prior art keywords
feature
statement
tested
matrix
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211265500.9A
Other languages
English (en)
Other versions
CN115905518A (zh
Inventor
余海波
蔡倩华
卢国钧
薛云
黄震华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202211265500.9A priority Critical patent/CN115905518B/zh
Publication of CN115905518A publication Critical patent/CN115905518A/zh
Application granted granted Critical
Publication of CN115905518B publication Critical patent/CN115905518B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Machine Translation (AREA)

Abstract

本发明涉及情感分析领域,特别涉及一种基于知识图谱的情感分类方法、装置、设备以及存储介质,通过构建待测语句的知识图谱,获取与所述知识图谱相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测语句进行情感分析,提升了情感分析的准确性以及效率。

Description

基于知识图谱的情感分类方法、装置、设备以及存储介质
技术领域
本发明涉及情感分析领域,特别涉及一种基于知识图谱的情感分类方法、装置、设备以及存储介质。
背景技术
方面级别情感分析是情感分析领域中的一项重要的子任务。近年来也引起了学术界的广泛关注。它主要预测句子关于某一特定方面词的情感极性(积极,消极或者中性)。这一技术通常应用于电商网站,社交等平台的在线评论中。
目前的技术方案,通过采用计算模型分析文本语句中关于某一特定的主题、服务、或产品的观点是正面的、中性的、还是负面的,有针对性对用户的情感进行分析。其中一个重要的解决方案是细粒度情感分类(Aspect-level sentiment classification,ALSC),即利用计算模型分析文本语句中关于某一特定的主题、服务、或产品的观点是正面的、中性的、还是负面的。然而现有的技术方案仅仅关注于在线评论的文本语句的上下文信息,无法准确地对文本语句进行准确的情感分析。
发明内容
基于此,本发明提供一种基于知识图谱的情感分类方法、装置、设备以及存储介质,通过构建待测语句的知识图谱,获取与所述知识图谱相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测语句进行情感分析,提升了情感分析的准确性以及效率。该技术方法如下:
第一方面,本申请实施例提供了一种基于知识图谱的情感分类方法,包括以下步骤:
获取待测语句以及预设的神经网络模型,其中,所述待测语句包括若干个单词,所述单词包括方面词,所述神经网络模型包括知识提取模块、句子编码模块、语义提取模块、句法提取模块、特征融合模块以及情感分析模块;
构建与所述待测语句相关联的知识图谱,其中,所述知识图谱包括若干个与方面词相关联的链接实体,以及若干个所述各个链接实体彼此的连接关系;
将所述知识图谱输入至所述知识提取模块,根据所述知识图谱中若干个链接实体,获取知识图谱嵌入矩阵,根据所述知识图谱中各个链接实体彼此的连接关系,获取知识图谱关系矩阵,其中,所述知识图谱关系矩阵包括若干个所述连接关系对应的特征向量;
根据所述知识图谱嵌入矩阵、知识图谱关系矩阵以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵,基于所述更新后的知识图谱嵌入矩阵,获取更新后的所述若干个链接实体的对应的特征向量,将更新后的所述若干个链接实体的对应的特征向量进行组合,获取所述待测语句的知识特征表示;
将所述待测语句输入至所述句子编码模块中,获得所述待测语句的前向特征表示以及后向特征表示,将所述待测语句的前向特征表示以及后向特征表示进行拼接,获得所述待测语句的双向特征表示;
将所述待测语句的双向特征表示输入至所述语义提取模块,获得所述待测语句的语义特征表示;
构建所述待测语句的目标邻接矩阵,将所述待测语句的双向特征表示以及目标邻接矩阵输入至所述句法提取模块中,获得所述待测语句的句法特征表示;
将所述待测语句的知识特征表示、语义特征表示以及句法特征表示输入至所述特征融合模块中,获得所述待测语句的融合特征表示;
将所述待测语句的融合特征表示输入至所述情感分析模块中,获取所述待测语句的情感分析结果。
第二方面,本申请实施例提供了一种基于知识图谱的情感分类装置,包括:
获取模块,用于获取待测语句以及预设的神经网络模型,其中,所述待测语句包括若干个单词,所述单词包括方面词,所述神经网络模型包括知识提取模块、句子编码模块、语义提取模块、句法提取模块、特征融合模块以及情感分析模块;
知识图谱构建模块,用于构建与所述待测语句相关联的知识图谱,其中,所述知识图谱包括若干个与方面词相关联的链接实体,以及若干个所述各个链接实体彼此的连接关系;
矩阵构建模块,用于将所述知识图谱输入至所述知识提取模块,根据所述知识图谱中若干个链接实体,获取知识图谱嵌入矩阵,根据所述知识图谱中各个链接实体彼此的连接关系,获取知识图谱关系矩阵,其中,所述知识图谱关系矩阵包括若干个所述连接关系对应的特征向量;
矩阵更新模块,用于根据所述知识图谱嵌入矩阵、知识图谱关系矩阵以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵,基于所述更新后的知识图谱嵌入矩阵,获取更新后的所述若干个链接实体的对应的特征向量,将更新后的所述若干个链接实体的对应的特征向量进行组合,获取所述待测语句的知识特征表示;
双向特征表示提取模块,用于将所述待测语句输入至所述句子编码模块中,获得所述待测语句的前向特征表示以及后向特征表示,将所述待测语句的前向特征表示以及后向特征表示进行拼接,获得所述待测语句的双向特征表示;
语义特征表示提取模块,用于将所述待测语句的双向特征表示输入至所述语义提取模块,获得所述待测语句的语义特征表示;
句法特征表示提取模块,用于构建所述待测语句的目标邻接矩阵,将所述待测语句的双向特征表示以及目标邻接矩阵输入至所述句法提取模块中,获得所述待测语句的句法特征表示;
特征融合模块,用于将所述待测语句的知识特征表示、语义特征表示以及句法特征表示输入至所述特征融合模块中,获得所述待测语句的融合特征表示;
情感分析模块,用于将所述待测语句的融合特征表示输入至所述情感分析模块中,获取所述待测语句的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的基于知识图谱的情感分类方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于知识图谱的情感分类方法的步骤。
在本实施例中,提供一种基于知识图谱的情感分类方法、装置、设备以及存储介质,通过构建待测语句的知识图谱,获取与所述知识图谱相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测语句进行情感分析,提升了情感分析的准确性以及效率。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请一个实施例提供的基于知识图谱的情感分类方法的流程示意图;
图2为本申请一个实施例提供的基于知识图谱的情感分类方法中S2的流程示意图;
图3为本申请一个实施例提供的基于知识图谱的情感分类方法中S4的流程示意图;
图4为本申请一个实施例提供的基于知识图谱的情感分类方法中S6的流程示意图;
图5为本申请一个实施例提供的基于知识图谱的情感分类方法中S7的流程示意图;
图6为本申请一个实施例提供的基于知识图谱的情感分类方法中S8的流程示意图;
图7为本申请一个实施例提供的基于知识图谱的情感分类方法中S9的流程示意图;
图8为本申请一个实施例提供的基于知识图谱的情感分类装置的结构示意图;
图9为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请一个实施例提供的基于知识图谱的情感分类方法的流程示意图,包括如下步骤:
S1:获取待测语句以及预设的神经网络模型。
本申请的基于知识图谱的情感分类方法的执行主体为基于知识图谱的情感分类方法的分析设备(以下简称分析设备)。
在一个可选的实施例中,分析设备可以是一台计算机设备,可以是服务器,或多台计算机设备联合而成的服务器机群。
在本实施例中,分析设备可以获取用户输入的待测语句,其中,所述待测语句包括若干个单词,所述单词包括上文单词、方面词以及下文单词,所述方面词为待测语句中所描述的某一实体,可以是名词。
分析设备获取预设的神经网络模型,其中,所述神经网络模型包括知识提取模块、句子编码模块、语义提取模块、句法提取模块、特征融合模块以及情感分析模块。
S2:构建与所述待测语句相关联的知识图谱。
在本实施例中,分析设备根据所述待测语句,构建与所述待测语句相关联的知识图谱,其中,所述知识图谱包括若干个与方面词相关联的链接实体,以及若干个所述各个链接实体彼此的连接关系。
请参阅图2,图2为本申请一个实施例提供的基于知识图谱的情感分类方法中S2的流程示意图,包括步骤S21~S22,具体如下:
S21:根据所述待测语句中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量。
所述双向编码器由一个预训练语言模型以及三个双向LSTM网络组成,所述预训练语言模型可以采用BERT(Bidirectional Encoder Representaion from Transformers)模型,也可以采用GloVe(Global Vector)模型。
在本实施例中,分析设备采用BERT模型作为所述预训练语言模型,将所述待测语句输入至所述BERT模型,获取所述BERT模型输出的待测语句的每一个词对应的特征,具体如下:
控制设备分别将上文,属性词,下文输入至所述BERT模型得到上文词特征矩阵C1,属性词词特征矩阵C2,下文词特征矩阵C3,其中,C1为矩阵,C2为/>矩阵,C3为/>矩阵,/>为上文中词的总数,/>为属性词中词的总数,/>为下文中词的总数。/>为BERT模型的输出特征维度;
将所述上文词特征矩阵C1输入至所述第一双向LSTM网络中得到上文隐藏层特征,将所述属性词特征矩阵C2输入至所述第二双向LSTM网络中得到属性词隐藏层特征/>,将所述下文词特征矩阵C3输入至所述第三双向LSTM网络中得到下文隐藏层特征/>
将上文隐藏层特征与下文隐藏层特征/>相加后得到上下文隐藏层特/>;将上下文隐藏层特征/>与属性词隐藏层特征/>进行哈达玛积得到属性词特征向量/>
所述特征均为/>维向量,/>为双向LSTM网络的输出特征维度。所述哈达玛积运算方式为对两特征中每个数值逐个相乘获得新特征。
在本实施例中,分析设备根据所述待测语句中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量。
S22:将所述方面词对应的特征向量分别与预设的知识图谱匹配池中若干个链接实体对应的特征向量进行匹配,获得所述若干个方面词相关联的链接实体,根据所述链接实体,获得所述各个链接实体彼此的连接关系,构建所述知识图谱。
所述知识图谱匹配池为一个矩阵/>,其中,/>的第i行向量/>代表第i个实体的特征。
特征向量与第i个实体的匹配度计算方式为,计算特征向量与预设的知识图谱匹配池中所有实体计算匹配度,匹配度最高的实体即为方面词相关联的链接实体。
在本实施例中,分析设备将所述方面词对应的特征向量输入至在所述知识图谱匹配池,将所述方面词对应的特征向量分别与所述知识图谱匹配池中若干个链接实体对应的特征向量进行匹配,获取所述方面词对应的特征向量与各个实体对应的匹配度,将匹配度最高的实体作为与所述待测语句相关联的链接实体。
根据所述链接实体,从所述知识图谱匹配池中获得所述各个链接实体彼此的连接关系,构建与所述待测语句相关联的知识图谱。
S3:将所述知识图谱输入至所述知识提取模块,根据所述知识图谱中若干个链接实体,获取知识图谱嵌入矩阵,根据所述知识图谱中各个链接实体彼此的连接关系,获取知识图谱关系矩阵。
所述知识图谱嵌入模型是应用于知识图谱的神经网络模型。其目标是为知识图谱中每个实体、关系计算出一种特征向量,使得知识图谱可以利用该特征向量来进行表示。
在本实施例中,分析设备将所述知识图谱输入至知识图谱嵌入模型中,根据所述知识图谱中若干个链接实体,获取与所述知识图谱的链接实体相关联的知识图谱嵌入矩阵,根据所述知识图谱中各个链接实体彼此的连接关系,获取知识图谱关系矩阵,其中,所述知识图谱关系矩阵包括若干个所述连接关系对应的特征向量。
具体地,所述知识图谱嵌入矩阵为一个的矩阵,其中,/>为所述知识图谱中链接实体的总数,/>为所述链接实体对应的特征向量的维度,/>为所述知识图谱嵌入矩阵中第i行的链接实体对应的特征向量。
所述知识图谱关系矩阵为一个的矩阵,其中,/>为所述知识图谱中连接关系的总数,/>为所述连接关系对应的特征向量的维度,/>为所述知识图谱关系矩阵中第i行的连接关系对应的特征向量。
S4:根据所述知识图谱嵌入矩阵、知识图谱关系矩阵以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵,基于所述更新后的知识图谱嵌入矩阵,获取更新后的所述若干个链接实体的对应的特征向量,将更新后的所述若干个链接实体的对应的特征向量进行组合,获取所述待测语句的知识特征表示。
在本实施例中,分析设备根据所述知识图谱嵌入矩阵、知识图谱关系矩阵以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵,基于所述更新后的知识图谱嵌入矩阵,获取更新后的所述若干个链接实体的对应的特征向量,将更新后的所述若干个链接实体的对应的特征向量进行组合,获取所述待测语句的知识特征表示。
根据所述知识图谱中的连接关系以及链接实体,可以将所述链接实体划分为头链接实体以及尾链接实体,请参阅图3,图3为本申请一个实施例提供的基于知识图谱的情感分类方法中S4的流程示意图,包括步骤S41~S42,具体如下:
S41:根据所述知识图谱中头链接实体、连接关系、尾链接实体在所述知识图谱嵌入矩阵以及知识图谱关系矩阵中的索引,构建正例三元组集以及负例三元组集。
在本实施例中,分析设备根据所述头链接实体在所述知识图谱嵌入矩阵中的索引,所述连接关系在所述知识图谱关系矩阵/>中的索引以及尾链接实体在所述知识图谱嵌入矩阵/>中的索引,构建正例三元组集,其中,所述正例三元组集包括若干个正例三元组,所述正例三元组为:
式中,为所述正例三元组中的头链接实体在所述知识图谱嵌入矩阵/>中的索引序号,/>为所述正例三元组中的连接关系在所述知识图谱关系矩阵/>中的索引序号,/>为所述正例三元组中的尾链接实体在所述知识图谱嵌入矩阵/>中的索引序号;
对所述若干个正例三元组中的头链接实体、连接关系以及尾链接实体进行随机替换,构建所述负例三元组集,其中,所述负例三元组集若干个负例三元组,所述负例三元组为:
式中,为所述负例三元组中的头链接实体在所述知识图谱嵌入矩阵/>中的索引序号,/>为所述负例三元组中的连接关系在所述知识图谱关系矩阵/>中的索引序号,/>为所述负例三元组中的尾链接实体在所述知识图谱嵌入矩阵/>中的索引序号。
S42:根据所述正例三元组集、负例三元组集以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵。
所述损失函数为:
式中,为所述损失函数,/>为双线性变换函数,具体地,/>,/>为所述知识图谱嵌入矩阵中的索引序号为/>的所述正例三元组的中的头链接实体对应的特征向量的转置;/>为所述知识图谱关系矩阵中索引序号为/>的所述正例三元组中的连接关系对应的特征向量,/>为所述知识图谱嵌入矩阵中的索引序号为/>的所述正例三元组的中的尾链接实体对应的特征向量;
在本实施例中,分析设备采用双线性变换方法,根据所述正例三元组集、负例三元组集以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵。具体地,分析设备根据所述损失函数,对所述神经网络模型进行多次迭代,并获取每一层迭代损失函数输出的损失值,根据该损失值,对神经网络模型的参数进行更新,当所述损失函数收敛后,获得该次迭代的神经网络模型的输出的知识图谱嵌入矩阵,作为更新后的知识图谱嵌入矩阵。
S5:将所述待测语句输入至所述句子编码模块中,获得所述待测语句的前向特征表示以及后向特征表示,将所述待测语句的前向特征表示以及后向特征表示进行拼接,获得所述待测语句的双向特征表示。
所述句子编码模块包括词嵌入模块以及编码模块。
所述词嵌入模块可以采用BERT(Bidirectional Encoder Representation fromTransformers)模型,也可以采用GloVe模型。在本实施例中,分析设备将所述待测语句输入至所述编码层中的词嵌入模块中,获得所述待测语句的词嵌入矩阵。
所述待测语句的句子表示为:
式中,S为所述待测语句的句子表示,包含了n个上下单词以及下文单词对应的向量和由m个方面词组成的方面词对应的向量/>
在本实施例中,分析设备将所述待测语句输入至所述词嵌入模块中,获得所述待测语句的词嵌入矩阵,其中,所述词嵌入矩阵包括所述待测语句中各个单词的词嵌入向量。
所述编码模块可以采用双向门控单元(Bi-GRU),为了提取到所述待测语句更深层次的特征,提高对所述待测语句的情感分析的精准性,在本实施例中,分析设备将所述待测语句的词嵌入矩阵输入至所述编码模块中,通过预设的编码函数进行编码,分别获得所述待测语句中若干个单词的前向特征以及后向特征,来捕获句子不同阅读方向的特征信息,具体如下:
式中,为所述前向特征,/>为所述后向特征,/>为编码函数;
将所述待测语句中各个单词的前向特征以及后向特征进行拼接,获得所述待测语句的若干个单词的双向特征,其中,所述双向特征为:
将所述待测语句的若干个单词的双向特征将更新后的所述若干个链接实体的对应的特征向量进行组合,获得所述待测语句的双向特征表示,其中,所述双向特征表示为:
S6:将所述待测语句的双向特征表示输入至所述语义提取模块,获得所述待测语句的语义特征表示。
分析设备将所述待测语句的双向特征表示输入至所述语义提取模块,获得所述待测语句的语义特征表示。
为了提取所述待测语句的语义信息,在本实施例中,分析设备采用注意力机制作为所述语义提取模块,来分别提取所述待测语句的语义特征表示。
请参阅图4,图4为本申请一个实施例提供的基于知识图谱的情感分类方法中S6的流程示意图,包括步骤S61~S62,具体如下:
S61:根据所述待测语句的双向特征表示以及预设的多头自注意力算法,获得所述待测语句的注意力权重矩阵。
所述多头自注意力算法为:
式中,为所述待测语句的注意力权重矩阵,/>为所述待测语句的双向特征表示,/>为预设的第一可训练权重参数矩阵,/>为预设的第二可训练权重参数矩阵,/>为多头自注意力的维度参数。
为了所述待测语句中每个单词对句子的情感信息的贡献,在本实施例中,分析设备根据所述待测语句的双向特征表示以及预设的多头自注意力算法,获得所述待测语句的注意力权重矩阵,以对所述双向特征表示赋予不同的权重,抽取出更加关键及重要的信息,提高对所述待测语句的情感分析的准确性。
S62:根据所述待测语句的注意力权重矩阵以及预设的语义特征计算算法,获得所述待测语句的语义特征表示。
所述语义特征表示包括若干个单词的语义特征向量,所述语义特征计算算法为:
式中,为所述待测语句的语义特征表示,/>为归一化指数函数,为预设的第三可训练权重参数矩阵。
在本实施例中,分析设备根据所述待测语句的注意力权重矩阵以及预设的语义特征计算算法,获得所述待测语句的语义特征表示。
S7:构建所述待测语句的目标邻接矩阵,将所述待测语句的双向特征表示以及目标邻接矩阵输入至所述句法提取模块中,获得所述待测语句的句法特征表示。
在本实施例中,分析设备构建所述待测语句的初始邻接矩阵,以表示所述待测语句中各个单词之间的连接关系,其中,所述初始邻接矩阵包括若干个目标邻接向量;
所述初始邻接矩阵为一个/>行/>列的矩阵,/>为所述初始邻接矩阵的目标邻接向量,当/>,代表单词i和单词j相连,反之,当/>,代表单词i和单词j不具有连接关系相连。
分析设备将所述初始邻接矩阵进行标准化,获得标准化后的目标邻接矩阵,具体如下:
其中,为所述待测语句的目标邻接矩阵,/>为所述初始邻接矩阵/>的度矩阵,,/>,/>以及/>为所述初始邻接矩阵/>的度矩阵的特征向量,/>为单位矩阵。
分析设备将所述待测语句的双向特征表示以及目标邻接矩阵输入至所述句法提取模块中,获得所述待测语句的句法特征表示。
请参阅图5,图5为本申请一个实施例提供的基于知识图谱的情感分类方法中S7的流程示意图,包括步骤S71,具体如下:
S71:将所述待测语句的双向特征表示作为所述多层图卷积网络的第一层的输入信息,根据所述目标邻接矩阵以及预设的句法特征计算算法,获得所述多层图卷积网络的最后一层输出特征表示,作为所述待测语句的句法特征表示。
所述句法特征计算算法为:
式中,为所述多层图卷积网络的第l+1层输出的句法特征表示,/>为所述多层图卷积网络的第l层输出的句法特征表示,/>为图卷积函数,/>为所述待测语句的目标邻接矩阵,/>为所述层图卷积网络的第l+1层的可训练权重参数矩阵。
其中,
RELU为一个非线性的激活函数。在本实施例中,分析设备将所述待测语句的双向特征表示作为所述多层图卷积网络的第一层的输入信息,根据所述目标邻接矩阵以及预设的句法特征计算算法,所述多层图卷积网络通过每一层的卷积计算,每一层都能在迭代计算中聚合其相邻层的信息并更新自身的信息。最终多层图卷积网络的最后一次迭代计算得到的输出特征表示,即最后一层输出特征表示,作为所述待测语句的句法特征表示。
S8:将所述待测语句的知识特征表示、语义特征表示以及句法特征表示输入至所述特征融合模块中,获得所述待测语句的融合特征表示。
所述待测语句的知识特征表示包括若干个单词的知识特征向量,所述上文单词以及下文单词的知识特征向量为预设的向量值,所述方面词的知识特征向量为相应的链接实体的对应的特征向量;
为了能充分且合理地利用所述待测语句的知识特征表示、语义特征表示以及句法特征,在本实施例中,分析设备将所述待测语句的知识特征表示、语义特征表示以及句法特征表示输入至所述特征融合模块中,获得所述待测语句的融合特征表示。
请参阅图6,图6为本申请一个实施例提供的基于知识图谱的情感分类方法中S8的流程示意图,包括步骤S81~S82,具体如下:
S81:将所述待测语句的语义特征表示、句法特征表示作为第一输入特征组,所述待测语句的知识特征表示、句法特征表示作为第二输入特征组,根据所述第一输入特征组、第二输入特征组以及预设的特征融合算法,分别获得所述待测语句的第一融合特征表示以及第二融合特征表示。
在本实施例中,分析设备将所述待测语句的语义特征表示、句法特征表示作为第一输入特征组,所述待测语句的知识特征表示、句法特征表示作为第二输入特征组,根据所述第一输入特征组、第二输入特征组以及预设的特征融合算法,分别获得所述待测语句的第一融合特征表示以及第二融合特征表示,具体如下:
式中,为所述待测语句的第一融合特征表示,/>为所述待测语句的第二融合特征表示,/>为所述待测语句的单词数目,i表示第i个单词,/>为所述待测语句的句法特征表示中第i个单词的句法特征向量,/>为所述待测语句的语义特征表示中第i个单词的语义特征向量,/>为所述待测语句的知识特征表示中第i个单词的知识特征向量。
S82:根据所述待测语句的第一融合特征表示、第二融合特征表示以及预设的噪声滤波算法,获得噪声滤波处理后的所述待测语句的第一融合特征表示以及第二融合特征表示,将所述噪声滤波处理后的所述待测语句的第一融合特征表示以及第二融合特征表示进行叉乘运算,获得所述待测语句的融合特征表示。
所述噪声滤除算法为:
式中,为噪声滤除后的所述待测语句的第一融合特征表示中第i个单词的第一融合特征向量,/>为噪声滤除后的所述待测语句的第二融合特征表示中第i个单词的第二融合特征向量,/>为所述待测语句的第一融合特征表示中第i个单词的第一融合特征向量,/>为所述待测语句的第二融合特征表示中第i个单词的第二融合特征向量,/>为预设的第四可训练权重参数矩阵,/>为预设的第五可训练权重参数矩阵,为预设的第一偏置参数矩阵,/>为预设的第二偏置参数矩阵。
在本实施例中,分析设备根据所述待测语句的第一融合特征表示、第二融合特征表示以及预设的噪声滤波算法,获得噪声滤波处理后的所述待测语句的第一融合特征表示以及第二融合特征表示,将所述噪声滤波处理后的所述待测语句的第一融合特征表示以及第二融合特征表示进行叉乘运算,获得所述待测语句的融合特征表示。
S9:将所述待测语句的融合特征表示输入至所述情感分析模块中,获取所述待测语句的情感分析结果。
在本实施例中,分析设备将所述待测语句的融合特征表示输入至所述情感分析模块中,获取所述待测语句的情感分析结果。
请参阅图7,图7为本申请一个实施例提供的基于知识图谱的情感分类方法中S9的流程示意图,包括步骤S91,具体如下:
S91:根据所述待测语句的融合特征表示以及预设的情感概率分布计算算法,获得情感概率分布向量,根据所述情感概率分布向量,获取概率最大的维度对应的情感极性,将所述情感极性作为所述待测语句的情感分析结果。
所述情感概率分布计算算法为:
式中,为所述情感概率分布向量,/>为归一化指数函数,/>为线性整流函数,/>为预设的第六可训练权重参数矩阵,/>预设的第三偏置参数矩阵;
在本实施例中,分析设备将根据所述待测语句的融合特征表示,利用softmax函数和单层感知机构建的情感概率分布计算算法,将所述融合特征表示输入至所述情感概率分布计算算法中,获得情感概率分布向量。
在本实施例中,分析设备根据所述情感概率分布向量,获取概率最大的维度对应的情感极性,作为所述待测语句的情感分析结果,具体地,当计算得到=[/>积极,/>消极,中性]=[0.1,0.7,0.2],概率最大为/>消极,其概率最大的维度对应的情感极性为消极,作为所述待测语句的情感分析结果。在一个可选的实施例中,还包括步骤训练所述神经网络模型,具体如下:
分析设备获取样本语句训练集以及相应的标签集,其中,所述样本语句训练集包括若干个样本语句,所述标签集包括若干个样本语句对应的真实情感极性。
构建所述神经网络模型的损失函数,将所述样本语句训练集输入至所述神经网络模型中,获得所述若干个样本语句对应的预测情感极性,根据所述若干个样本语句对应的预测情感极性、真实情感极性以及所述损失函数,对所述神经网络模型进行训练,获得训练好的神经网络模型,其中,所述损失函数为:
式中,其中e表示第e个样本语句,f表示第f种类型的情感极性,共有N种情感极性,为所述真实情感极性,/>为所述预测情感极性。
在一个可选的实施例中,本申请还提供一种网络信息推荐方法,所述网络信息推荐方法应用了上述基于知识图谱的情感分类方法,首先获取社交网络平台上用户发表的评论信息,作为所述待测语句,并构建与所述待测语句中若干个待测语句相关联的知识图谱。根据本申请提供的所述基于知识图谱的情感分类方法,获得所述待测语句的情感分析结果。并根据所述待测语句的情感分析结果,获取情感极性为积极的待测语句及其对应的评论信息,获取发表所述评论信息的用户的用户标识,根据所述用户标识,向所述用户推送与情感极性为积极的所述待测语句相关联的网络信息。
在本实施例中,所述待测语句是基于社交网络平台获取的数据集,例如Twitter、Youtube等社交网络平台,分析设备通过与所述社交网络平台进行连接,获取用户对某一服务或者产品发表的评论信息,作为所述待测语句,并构建与所述待测语句中若干个待测语句相关联的知识图谱。
当分析后获取所述待测语句的情感分析结果后,分析设备根据所述情感分析结果获取其中情感极性为积极的待测语句,获取对应的用户发表的评论信息,以及对应的用户标识,向相应的用户推送相关联的网络信息,所述网络信息可以是相关的服务信息或者产品信息。
请参阅图8,图8为本申请一个实施例提供的基于知识图谱的情感分类装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现基于知识图谱的情感分类方法的全部或一部分,该装置8包括:
获取模块81,用于获取待测语句以及预设的神经网络模型,其中,所述待测语句包括若干个单词,所述单词包括方面词,所述神经网络模型包括知识提取模块、句子编码模块、语义提取模块、句法提取模块、特征融合模块以及情感分析模块;
知识图谱构建模块82,用于构建与所述待测语句相关联的知识图谱,其中,所述知识图谱包括若干个与方面词相关联的链接实体,以及若干个所述各个链接实体彼此的连接关系;
矩阵构建模块83,用于将所述知识图谱输入至所述知识提取模块,根据所述知识图谱中若干个链接实体,获取知识图谱嵌入矩阵,根据所述知识图谱中各个链接实体彼此的连接关系,获取知识图谱关系矩阵,其中,所述知识图谱关系矩阵包括若干个所述连接关系对应的特征向量;
矩阵更新模块84,用于根据所述知识图谱嵌入矩阵、知识图谱关系矩阵以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵,基于所述更新后的知识图谱嵌入矩阵,获取更新后的所述若干个链接实体的对应的特征向量,将更新后的所述若干个链接实体的对应的特征向量进行组合,获取所述待测语句的知识特征表示;
双向特征表示提取模块85,用于将所述待测语句输入至所述句子编码模块中,获得所述待测语句的前向特征表示以及后向特征表示,将所述待测语句的前向特征表示以及后向特征表示进行拼接,获得所述待测语句的双向特征表示;
语义特征表示提取模块86,用于将所述待测语句的双向特征表示输入至所述语义提取模块,获得所述待测语句的语义特征表示;
句法特征表示提取模块87,用于构建所述待测语句的目标邻接矩阵,将所述待测语句的双向特征表示以及目标邻接矩阵输入至所述句法提取模块中,获得所述待测语句的句法特征表示;
特征融合模块88,用于将所述待测语句的知识特征表示、语义特征表示以及句法特征表示输入至所述特征融合模块中,获得所述待测语句的融合特征表示;
情感分析模块89,用于将所述待测语句的融合特征表示输入至所述情感分析模块中,获取所述待测语句的情感分析结果。
在本申请的实施例中,通过获取模块,获取待测语句以及预设的神经网络模型,其中,所述待测语句包括若干个单词,所述单词包括方面词,所述神经网络模型包括知识提取模块、句子编码模块、语义提取模块、句法提取模块、特征融合模块以及情感分析模块;通过知识图谱构建模块,构建与所述待测语句相关联的知识图谱,其中,所述知识图谱包括若干个与方面词相关联的链接实体,以及若干个所述各个链接实体彼此的连接关系;通过矩阵构建模块,将所述知识图谱输入至所述知识提取模块,根据所述知识图谱中若干个链接实体,获取知识图谱嵌入矩阵,根据所述知识图谱中各个链接实体彼此的连接关系,获取知识图谱关系矩阵,其中,所述知识图谱关系矩阵包括若干个所述连接关系对应的特征向量;通过矩阵更新模块,根据所述知识图谱嵌入矩阵、知识图谱关系矩阵以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵,基于所述更新后的知识图谱嵌入矩阵,获取更新后的所述若干个链接实体的对应的特征向量,将更新后的所述若干个链接实体的对应的特征向量进行组合,获取所述待测语句的知识特征表示;通过双向特征表示提取模块,将所述待测语句输入至所述句子编码模块中,获得所述待测语句的前向特征表示以及后向特征表示,将所述待测语句的前向特征表示以及后向特征表示进行拼接,获得所述待测语句的双向特征表示;通过语义特征表示提取模块,将所述待测语句的双向特征表示输入至所述语义提取模块,获得所述待测语句的语义特征表示;通过句法特征表示提取模块,构建所述待测语句的目标邻接矩阵,将所述待测语句的双向特征表示以及目标邻接矩阵输入至所述句法提取模块中,获得所述待测语句的句法特征表示;通过特征融合模块,将所述待测语句的知识特征表示、语义特征表示以及句法特征表示输入至所述特征融合模块中,获得所述待测语句的融合特征表示;通过情感分析模块,将所述待测语句的融合特征表示输入至所述情感分析模块中,获取所述待测语句的情感分析结果。
本申请通过构建待测语句的知识图谱,获取与所述知识图谱相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测语句进行情感分析,提升了情感分析的准确性以及效率。
请参考图9,图9为本申请一个实施例提供的计算机设备的结构示意图,计算机设备8包括:处理器91、存储器92以及存储在存储器92上并可在处理器91上运行的计算机程序93;计算机设备可以存储有多条指令,指令适用于由处理器91加载并执行上述图1至图7所述实施例的方法步骤,具体执行过程可以参见图1至图7所述实施例的具体说明,在此不进行赘述。
其中,处理器91可以包括一个或多个处理核心。处理器91利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器92内的指令、程序、代码集或指令集,以及调用存储器92内的数据,执行基于知识图谱的情感分类装置6的各种功能和处理数据,可选的,处理器91可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrambleLogic Array,PLA)中的至少一个硬件形式来实现。处理器91可集成中央处理器91(CentralProcessing Unit,CPU)、图像处理器91(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器91中,单独通过一块芯片进行实现。
其中,存储器92可以包括随机存储器92(Random Access Memory,RAM),也可以包括只读存储器92(Read-Only Memory)。可选的,该存储器92包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器92可用于存储指令、程序、代码、代码集或指令集。存储器92可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器92可选的还可以是至少一个位于远离前述处理器91的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行所示实施例一至实施例三的方法步骤,具体执行过程可以参见所示图1至图7所述实施例的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。

Claims (10)

1.一种基于知识图谱的情感分类方法,其特征在于,包括以下步骤:
获取待测语句以及预设的神经网络模型,其中,所述待测语句包括若干个单词,所述单词包括方面词,所述神经网络模型包括知识提取模块、句子编码模块、语义提取模块、句法提取模块、特征融合模块以及情感分析模块;
构建与所述待测语句相关联的知识图谱,其中,所述知识图谱包括若干个与方面词相关联的链接实体,以及若干个所述各个链接实体彼此的连接关系;
将所述知识图谱输入至所述知识提取模块,根据所述知识图谱中若干个链接实体,获取知识图谱嵌入矩阵,根据所述知识图谱中各个链接实体彼此的连接关系,获取知识图谱关系矩阵,其中,所述知识图谱关系矩阵包括若干个所述连接关系对应的特征向量;
根据所述知识图谱嵌入矩阵、知识图谱关系矩阵以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵,基于所述更新后的知识图谱嵌入矩阵,获取更新后的所述若干个链接实体的对应的特征向量,将更新后的所述若干个链接实体的对应的特征向量进行组合,获取所述待测语句的知识特征表示;
将所述待测语句输入至所述句子编码模块中,获得所述待测语句的前向特征表示以及后向特征表示,将所述待测语句的前向特征表示以及后向特征表示进行拼接,获得所述待测语句的双向特征表示;
将所述待测语句的双向特征表示输入至所述语义提取模块,获得所述待测语句的语义特征表示;
构建所述待测语句的目标邻接矩阵,将所述待测语句的双向特征表示以及目标邻接矩阵输入至所述句法提取模块中,获得所述待测语句的句法特征表示;
将所述待测语句的知识特征表示、语义特征表示以及句法特征表示输入至所述特征融合模块中,获得所述待测语句的融合特征表示;
将所述待测语句的融合特征表示输入至所述情感分析模块中,获取所述待测语句的情感分析结果。
2.根据权利要求1所述的基于知识图谱的情感分类方法,其特征在于:所述单词还包括上文单词以及下文单词;
所述构建与所述待测语句相关联的知识图谱,包括步骤:
根据所述待测语句的上文单词、方面词、下文单词以及预设的双向编码器,获取所述方面词对应的特征向量;
将所述方面词对应的特征向量分别与预设的知识图谱匹配池中若干个链接实体对应的特征向量进行匹配,获得所述若干个方面词相关联的链接实体,根据所述链接实体,获得所述各个链接实体彼此的连接关系,构建所述知识图谱。
3.根据权利要求2所述的基于知识图谱的情感分类方法,其特征在于:所述链接实体包括头链接实体以及尾链接实体;
所述根据所述知识图谱嵌入矩阵、知识图谱关系矩阵以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵,包括步骤:
根据所述知识图谱中头链接实体、连接关系、尾链接实体在所述知识图谱嵌入矩阵以及知识图谱关系矩阵中的索引,构建正例三元组集以及负例三元组集,其中,所述正例三元组集包括若干个正例三元组,所述负例三元组集若干个负例三元组,所述正例三元组为:
式中,为所述正例三元组中的头链接实体在所述知识图谱嵌入矩阵中的索引序号,/>为所述正例三元组中的连接关系在所述知识图谱关系矩阵中的索引序号,/>为所述正例三元组中的尾链接实体在所述知识图谱嵌入矩阵中的索引序号;
所述负例三元组为:
式中,为所述负例三元组中的头链接实体在所述知识图谱嵌入矩阵中的索引序号,/>为所述负例三元组中的连接关系在所述知识图谱关系矩阵中的索引序号,/>为所述负例三元组中的尾链接实体在所述知识图谱嵌入矩阵中的索引序号;
根据所述正例三元组集、负例三元组集以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵,其中,所述损失函数为:
式中,为所述损失函数,/>为双线性变换函数,具体地,/>,/>为所述知识图谱嵌入矩阵中的索引序号为/>的所述正例三元组的中的头链接实体对应的特征向量的转置;/>为所述知识图谱关系矩阵中索引序号为/>的所述正例三元组中的连接关系对应的特征向量,/>为所述知识图谱嵌入矩阵中的索引序号为/>的所述正例三元组的中的尾链接实体对应的特征向量。
4.根据权利要求1所述的基于知识图谱的情感分类方法,其特征在于,所述将所述待测语句的双向特征表示输入至所述语义提取模块,获得所述待测语句的语义特征表示,包括步骤:
根据所述待测语句的双向特征表示以及预设的多头自注意力算法,获得所述待测语句的注意力权重矩阵,其中,所述多头自注意力算法为:
式中,为所述待测语句的注意力权重矩阵,/>为所述待测语句的双向特征表示,/>为预设的第一可训练权重参数矩阵,/>为预设的第二可训练权重参数矩阵,/>为多头自注意力的维度参数;
根据所述待测语句的注意力权重矩阵以及预设的语义特征计算算法,获得所述待测语句的语义特征表示,其中,所述语义特征表示包括若干个单词的语义特征向量,所述语义特征计算算法为:
式中,为所述待测语句的语义特征表示,/>为归一化指数函数,/>为预设的第三可训练权重参数矩阵。
5.根据权利要求1所述的基于知识图谱的情感分类方法,其特征在于:所述句法提取模块为多层图卷积网络;
所述将所述待测语句的双向特征表示以及目标邻接矩阵输入至所述句法提取模块中,包括步骤:
将所述待测语句的双向特征表示作为所述多层图卷积网络的第一层的输入信息,根据所述目标邻接矩阵以及预设的句法特征计算算法,获得所述多层图卷积网络的最后一层输出特征表示,作为所述待测语句的句法特征表示,其中,所述句法特征表示包括若干个单词的句法特征向量,所述句法特征计算算法为:
式中,为所述多层图卷积网络的第l+1层输出的句法特征表示,/>为所述多层图卷积网络的第l层输出的句法特征表示,/>为图卷积函数,/>为所述待测语句的目标邻接矩阵,/>为所述层图卷积网络的第l+1层的可训练权重参数矩阵。
6.根据权利要求2所述的基于知识图谱的情感分类方法,其特征在于:所述知识特征表示包括若干个单词的知识特征向量,所述上文单词以及下文单词的知识特征向量为预设的向量值,所述方面词的知识特征向量为相应的链接实体的对应的特征向量;
所述将所述待测语句的知识特征表示、语义特征表示以及句法特征表示输入至所述特征融合模块中,获得所述待测语句的融合特征表示,包括步骤:
将所述待测语句的语义特征表示、句法特征表示作为第一输入特征组,所述待测语句的知识特征表示、句法特征表示作为第二输入特征组;根据所述第一输入特征组、第二输入特征组以及预设的特征融合算法,分别获得所述待测语句的第一融合特征表示以及第二融合特征表示,具体如下:
式中,为所述待测语句的第一融合特征表示,/>为所述待测语句的第二融合特征表示,/>为所述待测语句的单词数目,i表示第i个单词,/>为所述待测语句的句法特征表示中第i个单词的句法特征向量,/>为所述待测语句的语义特征表示中第i个单词的语义特征向量,/>为所述待测语句的知识特征表示中第i个单词的知识特征向量;
根据所述待测语句的第一融合特征表示、第二融合特征表示以及预设的噪声滤波算法,获得噪声滤波处理后的所述待测语句的第一融合特征表示以及第二融合特征表示,将所述噪声滤波处理后的所述待测语句的第一融合特征表示以及第二融合特征表示进行叉乘运算,获得所述待测语句的融合特征表示,其中,所述噪声滤除算法为:
式中,为噪声滤除后的所述待测语句的第一融合特征表示中第i个单词的第一融合特征向量,/>为噪声滤除后的所述待测语句的第二融合特征表示中第i个单词的第二融合特征向量,/>为所述待测语句的第一融合特征表示中第i个单词的第一融合特征向量,/>为所述待测语句的第二融合特征表示中第i个单词的第二融合特征向量,/>为预设的第四可训练权重参数矩阵,/>为预设的第五可训练权重参数矩阵,/>为预设的第一偏置参数矩阵,/>为预设的第二偏置参数矩阵。
7.根据权利要求1所述的基于知识图谱的情感分类方法,其特征在于,所述将所述待测语句的融合特征表示输入至所述情感分析模块中,获取所述待测语句的情感分析结果,包括步骤:
根据所述待测语句的融合特征表示以及预设的情感概率分布计算算法,获得情感概率分布向量,根据所述情感概率分布向量,获取概率最大的维度对应的情感极性,将所述情感极性作为所述待测语句的情感分析结果,其中,所述情感概率分布计算算法为:
式中,为所述情感概率分布向量,/>为归一化指数函数,/>为线性整流函数,/>为预设的第六可训练权重参数矩阵,/>预设的第三偏置参数矩阵。
8.一种基于知识图谱的情感分类装置,其特征在于,包括:
获取模块,用于获取待测语句以及预设的神经网络模型,其中,所述待测语句包括若干个单词,所述单词包括方面词,所述神经网络模型包括知识提取模块、句子编码模块、语义提取模块、句法提取模块、特征融合模块以及情感分析模块;
知识图谱构建模块,用于构建与所述待测语句相关联的知识图谱,其中,所述知识图谱包括若干个与方面词相关联的链接实体,以及若干个所述各个链接实体彼此的连接关系;
矩阵构建模块,用于将所述知识图谱输入至所述知识提取模块,根据所述知识图谱中若干个链接实体,获取知识图谱嵌入矩阵,根据所述知识图谱中各个链接实体彼此的连接关系,获取知识图谱关系矩阵,其中,所述知识图谱关系矩阵包括若干个所述连接关系对应的特征向量;
矩阵更新模块,用于根据所述知识图谱嵌入矩阵、知识图谱关系矩阵以及预设的损失函数,对所述知识图谱嵌入矩阵进行更新,获取更新后的知识图谱嵌入矩阵,基于所述更新后的知识图谱嵌入矩阵,获取更新后的所述若干个链接实体的对应的特征向量,将更新后的所述若干个链接实体的对应的特征向量进行组合,获取所述待测语句的知识特征表示;
双向特征表示提取模块,用于将所述待测语句输入至所述句子编码模块中,获得所述待测语句的前向特征表示以及后向特征表示,将所述待测语句的前向特征表示以及后向特征表示进行拼接,获得所述待测语句的双向特征表示;
语义特征表示提取模块,用于将所述待测语句的双向特征表示输入至所述语义提取模块,获得所述待测语句的语义特征表示;
句法特征表示提取模块,用于构建所述待测语句的目标邻接矩阵,将所述待测语句的双向特征表示以及目标邻接矩阵输入至所述句法提取模块中,获得所述待测语句的句法特征表示;
特征融合模块,用于将所述待测语句的知识特征表示、语义特征表示以及句法特征表示输入至所述特征融合模块中,获得所述待测语句的融合特征表示;
情感分析模块,用于将所述待测语句的融合特征表示输入至所述情感分析模块中,获取所述待测语句的情感分析结果。
9.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于知识图谱的情感分类方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于知识图谱的情感分类方法的步骤。
CN202211265500.9A 2022-10-17 2022-10-17 基于知识图谱的情感分类方法、装置、设备以及存储介质 Active CN115905518B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211265500.9A CN115905518B (zh) 2022-10-17 2022-10-17 基于知识图谱的情感分类方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211265500.9A CN115905518B (zh) 2022-10-17 2022-10-17 基于知识图谱的情感分类方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN115905518A CN115905518A (zh) 2023-04-04
CN115905518B true CN115905518B (zh) 2023-10-20

Family

ID=86488809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211265500.9A Active CN115905518B (zh) 2022-10-17 2022-10-17 基于知识图谱的情感分类方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN115905518B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116186295B (zh) * 2023-04-28 2023-07-18 湖南工商大学 基于注意力的知识图谱链接预测方法、装置、设备及介质

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339255A (zh) * 2020-02-26 2020-06-26 腾讯科技(深圳)有限公司 目标情感分析的方法、模型训练方法、介质和设备
CN111538835A (zh) * 2020-03-30 2020-08-14 东南大学 一种基于知识图谱的社交媒体情感分类方法与装置
CN111914096A (zh) * 2020-07-06 2020-11-10 同济大学 基于舆情知识图谱的公共交通乘客满意度评价方法及系统
CN112347248A (zh) * 2020-10-30 2021-02-09 山东师范大学 一种方面级文本情感分类方法及系统
WO2021114840A1 (zh) * 2020-05-28 2021-06-17 平安科技(深圳)有限公司 基于语义分析的评分方法、装置、终端设备及存储介质
CN113268603A (zh) * 2021-05-08 2021-08-17 大箴(杭州)科技有限公司 一种新闻舆情知识图谱的构建方法及装置、介质、设备
CN113435211A (zh) * 2021-07-19 2021-09-24 北京理工大学 一种结合外部知识的文本隐式情感分析方法
US11194972B1 (en) * 2021-02-19 2021-12-07 Institute Of Automation, Chinese Academy Of Sciences Semantic sentiment analysis method fusing in-depth features and time sequence models
CN114492459A (zh) * 2022-02-25 2022-05-13 福州大学 基于知识图谱与交互图卷积的评论情感分析方法及系统
CN114547312A (zh) * 2022-04-07 2022-05-27 华南师范大学 基于常识知识图谱的情感分析方法、装置以及设备
CN114676704A (zh) * 2022-05-30 2022-06-28 华南师范大学 句子情感分析方法、装置、设备以及存储介质
CN114912458A (zh) * 2021-02-08 2022-08-16 西门子股份公司 一种情感分析方法、装置和计算机可读介质
CN115033695A (zh) * 2022-06-15 2022-09-09 天津大学 一种基于常识知识图谱的长对话情感检测方法及系统
CN115048938A (zh) * 2022-06-13 2022-09-13 华南师范大学 基于语义和句法双通道的语句情感分析方法以及装置
CN115080688A (zh) * 2022-06-13 2022-09-20 华南理工大学 一种少样本跨领域情感分析方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10726207B2 (en) * 2018-11-27 2020-07-28 Sap Se Exploiting document knowledge for aspect-level sentiment classification
CN111680159B (zh) * 2020-06-11 2023-08-29 华东交通大学 数据处理方法、装置及电子设备
US11694042B2 (en) * 2020-06-16 2023-07-04 Baidu Usa Llc Cross-lingual unsupervised classification with multi-view transfer learning
US11868730B2 (en) * 2020-09-23 2024-01-09 Jingdong Digits Technology Holding Co., Ltd. Method and system for aspect-level sentiment classification by graph diffusion transformer
US20220230628A1 (en) * 2021-01-20 2022-07-21 Microsoft Technology Licensing, Llc Generation of optimized spoken language understanding model through joint training with integrated knowledge-language module

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111339255A (zh) * 2020-02-26 2020-06-26 腾讯科技(深圳)有限公司 目标情感分析的方法、模型训练方法、介质和设备
CN111538835A (zh) * 2020-03-30 2020-08-14 东南大学 一种基于知识图谱的社交媒体情感分类方法与装置
WO2021114840A1 (zh) * 2020-05-28 2021-06-17 平安科技(深圳)有限公司 基于语义分析的评分方法、装置、终端设备及存储介质
CN111914096A (zh) * 2020-07-06 2020-11-10 同济大学 基于舆情知识图谱的公共交通乘客满意度评价方法及系统
CN112347248A (zh) * 2020-10-30 2021-02-09 山东师范大学 一种方面级文本情感分类方法及系统
CN114912458A (zh) * 2021-02-08 2022-08-16 西门子股份公司 一种情感分析方法、装置和计算机可读介质
US11194972B1 (en) * 2021-02-19 2021-12-07 Institute Of Automation, Chinese Academy Of Sciences Semantic sentiment analysis method fusing in-depth features and time sequence models
CN113268603A (zh) * 2021-05-08 2021-08-17 大箴(杭州)科技有限公司 一种新闻舆情知识图谱的构建方法及装置、介质、设备
CN113435211A (zh) * 2021-07-19 2021-09-24 北京理工大学 一种结合外部知识的文本隐式情感分析方法
CN114492459A (zh) * 2022-02-25 2022-05-13 福州大学 基于知识图谱与交互图卷积的评论情感分析方法及系统
CN114547312A (zh) * 2022-04-07 2022-05-27 华南师范大学 基于常识知识图谱的情感分析方法、装置以及设备
CN114676704A (zh) * 2022-05-30 2022-06-28 华南师范大学 句子情感分析方法、装置、设备以及存储介质
CN115048938A (zh) * 2022-06-13 2022-09-13 华南师范大学 基于语义和句法双通道的语句情感分析方法以及装置
CN115080688A (zh) * 2022-06-13 2022-09-20 华南理工大学 一种少样本跨领域情感分析方法及装置
CN115033695A (zh) * 2022-06-15 2022-09-09 天津大学 一种基于常识知识图谱的长对话情感检测方法及系统

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
A Novel Bi-Branch Graph Convolutional Neural Network for Aspect Level Sentiment Classification;Bingliang Chen et.al;《2021 International Joint Conference on Neural Networks (IJCNN)》;全文 *
基于保序子矩阵和频繁序列模式挖掘的文本情感特征提取方法;陈鑫,薛云,卢昕,李万理,赵洪雅,胡晓晖;《山东大学学报(理学版)》;全文 *
基于多通道双向长短期记忆网络的情感分析;李卫疆;漆芳;;中文信息学报(12);全文 *
基于多项式贝叶斯分类模型的短文本多情感倾向分析及实现;刘正,黄震华;《现代计算机(专业版)》;全文 *
基于层次注意力机制和门机制的属性级别情感分析;冯超,黎海辉,赵洪雅,薛云,唐婧尧;《中文信息学报》;全文 *
基于方面情感的层次化双注意力网络;宋婷;陈战伟;;信息技术与网络安全(06);全文 *
基于知识图谱与循环注意力网络的视角级情感分析;邓立明;魏晶晶;吴运兵;余小燕;廖祥文;;模式识别与人工智能(第06期);全文 *
文本细粒度情感分析研究综述;谭翠萍;《大学图书馆学报》;全文 *
文本细粒度情感分析综述;王海燕,陶皖,余玲艳等;《河南科技学院学报(自然科学版)》;全文 *
知识增强的交互注意力方面级情感分析模型;韩虎,郝俊,张千锟,孟甜甜;《计算机科学与探索》;全文 *
面向中文网络评论情感分类的集成学习框架;黄佳锋,薛云,卢昕等;《中文信息学报》;全文 *

Also Published As

Publication number Publication date
CN115905518A (zh) 2023-04-04

Similar Documents

Publication Publication Date Title
CN114676704B (zh) 句子情感分析方法、装置、设备以及存储介质
CN107609185B (zh) 用于poi的相似度计算的方法、装置、设备和计算机可读存储介质
CN108288067A (zh) 图像文本匹配模型的训练方法、双向搜索方法及相关装置
CN115204183B (zh) 基于知识增强的双通道情感分析方法、装置以及设备
CN116089619B (zh) 情感分类方法、装置、设备以及存储介质
CN116402063B (zh) 多模态讽刺识别方法、装置、设备以及存储介质
CN111737586B (zh) 信息推荐方法、装置、设备及计算机可读存储介质
CN115168592B (zh) 基于方面类别的语句情感分析方法、装置以及设备
CN115587597B (zh) 基于子句级关系图的方面词的情感分析方法以及装置
CN112580720A (zh) 一种模型训练方法及装置
CN116151263B (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN115905518B (zh) 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN112561031A (zh) 基于人工智能的模型搜索方法、装置及电子设备
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN117633516B (zh) 多模态嘲讽检测方法、装置、计算机设备以及存储介质
JP7081454B2 (ja) 処理装置、処理方法、及び処理プログラム
CN117149998B (zh) 基于多目标优化的智能就诊推荐方法及系统
CN115827878B (zh) 语句情感分析方法、装置以及设备
CN115659987B (zh) 基于双通道的多模态命名实体识别方法、装置以及设备
CN114547312B (zh) 基于常识知识图谱的情感分析方法、装置以及设备
CN115659951B (zh) 基于标签嵌入的语句情感分析方法、装置以及设备
CN113505583A (zh) 基于语义决策图神经网络的情感原因子句对提取方法
CN115618884B (zh) 基于多任务学习的言论分析方法、装置以及设备
CN115206421B (zh) 药物重定位方法、重定位模型的训练方法及装置
CN115033700A (zh) 基于相互学习网络的跨领域情感分析方法、装置以及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant