CN114547312B - 基于常识知识图谱的情感分析方法、装置以及设备 - Google Patents
基于常识知识图谱的情感分析方法、装置以及设备 Download PDFInfo
- Publication number
- CN114547312B CN114547312B CN202210360819.3A CN202210360819A CN114547312B CN 114547312 B CN114547312 B CN 114547312B CN 202210360819 A CN202210360819 A CN 202210360819A CN 114547312 B CN114547312 B CN 114547312B
- Authority
- CN
- China
- Prior art keywords
- knowledge
- graph
- matrix
- feature vector
- embedding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
- G06F16/345—Summarisation for human users
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及情感分析领域,特别涉及一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质,通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。
Description
技术领域
本发明涉及情感分析领域,特别涉及一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质。
背景技术
如今,人们可以随时通过社交网站、博客或电商平台发表评论以表达他们对各种服务或产品的想法,这些在线评论影响着未来消费者的购买决策,同时也正成为衡量企业质量的重要的标准。为了给企业带来更高的收益,一个更为有效的情感分析方法也越来越被视为一项至关重要的任务。
目前的技术方案,通过采用计算模型分析文本语句中关于某一特定的主题、服务、或产品的观点是正面的、中性的、还是负面的,有针对性对用户的情感进行分析。其中一个重要的解决方案是细粒度情感分类(Aspect-level sentiment classification,ALSC),即利用计算模型分析文本语句中关于某一特定的主题、服务、或产品的观点是正面的、中性的、还是负面的。然而现有的技术方案仅仅关注于在线评论的文本语句的上下文信息,无法准确地对文本语句进行准确的情感分析。
发明内容
基于此,本发明提供一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质,通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。
该技术方法如下:
第一方面,本申请实施例提供了一种基于常识知识图谱的情感分析方法,包括以下步骤:
获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
第二方面,本申请实施例提供了一种基于常识知识图谱的情感分析装置,包括:
获取模块,用于获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
知识图谱嵌入矩阵构建模块,用于根据所述链接实体以及预设的知识图谱嵌入模型,获取与所述链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
摘要特征向量矩阵构建模块,用于根据所述摘要文本以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
常识特征向量获取模块,用于根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
情感分析模块,用于获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的基于常识知识图谱的情感分析方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于常识知识图谱的情感分析方法的步骤。
在本实施例中,提供一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质,通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请第一实施例提供的基于常识知识图谱的情感分析方法的流程示意图;
图2为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S1的流程示意图;
图3为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S2的流程示意图;
图4为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S4的流程示意图;
图5为本申请另一个实施例提供的基于常识知识图谱的情感分析方法的流程示意图;
图6为本申请第一实施例提供的基于常识知识图谱的情感分析方法中S5的流程示意图;
图7为本申请一个实施例提供的基于常识知识图谱的情感分析装置的结构示意图;
图8为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请第一实施例提供的基于常识知识图谱的情感分析方法的流程示意图,包括如下步骤:
S1:获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图。
本申请的基于常识知识图谱的情感分析方法的执行主体为基于常识知识图谱的情感分析方法的分析设备(以下简称分析设备)。
在一个可选的实施例中,分析设备可以是一台计算机设备,可以是服务器,或多台计算机设备联合而成的服务器机群。
每一个待测文本数据集包含若干个待测句子以及标记好的待测句子中的上文、属性词以及下文的位置,所述待测句子包括上文、与所述链接实体相关联的属性词以及下文,所述属性词为待测句子中所描述的某一实体,可以是名词。
在一个可选的实施例中,所述待测文本数据集可以是SemEval2014中的Restaurant和Laptop14数据集,分析设备可以获取用户输入的待测文本数据集,并构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体、与所述链接实体对应的摘要文本以及与所述待测句子相关联的各个链接实体彼此的连接关系,所述链接实体包括头链接实体以及尾链接实体。
请参阅图2,图2为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S1的流程示意图,包括步骤S101~S102,具体如下:
S101:根据所述待测句子中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量。
所述双向编码器由一个预训练语言模型以及三个双向LSTM网络组成,所述预训练语言模型可以采用BERT(Bidirectional Encoder Representaion from Transformers)模型,也可以采用GloVe(Global Vector)模型。
在本实施例中,分析设备采用BERT模型作为所述预训练语言模型,将所述待测句子输入至所述BERT模型,获取所述BERT模型输出的待测句子的每一个词对应的特征,具体如下:
控制设备分别将上文,属性词,下文输入至所述BERT模型得到上文词特征矩阵C1,属性词词特征矩阵C2,下文词特征矩阵C3,其中,C1为矩阵,C2为矩阵,C3为矩阵,为上文中词的总数,为属性词中词的总数,为下文中词的总数。为BERT模型的输出特征维度;
将所述上文词特征矩阵C1输入至所述第一双向LSTM网络中得到上文隐藏层特征,将所述属性词特征矩阵C2输入至所述第二双向LSTM网络中得到属性词隐藏层特征,将所述下文词特征矩阵C3输入至所述第三双向LSTM网络中得到下文隐藏层特征;
在本实施例中,分析设备根据所述待测句子中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量。
S102:根据所述属性特征向量以及预设的知识图谱匹配池,从所述知识图谱匹配池中获取与所述待测句子相关联的链接实体,以及与所述链接实体对应的摘要文本,构建与所述待测句子相关联的知识图谱子图。
在本实施例中,分析设备将所述属性特征向量输入至在所述知识图谱匹配池,将所述属性特征向量与所述知识图谱匹配池中的实体进行匹配,获取属性特征向量与各个实体对应的匹配度,将匹配度最高的实体作为与所述待测句子相关联的链接实体。
根据所述链接实体,从所述知识图谱匹配池中获取与所述链接实体对应的摘要文本以及与所述待测句子相关联的各个链接实体彼此的连接关系,构建与所述待测句子相关联的知识图谱子图。
S2:根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵。
所述知识图谱嵌入模型是应用于知识图谱的神经网络模型。其目标是为知识图谱中每个实体、关系计算出一种特征向量,使得知识图谱可以利用该特征向量来进行表示。
请参阅图3,图3为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S2的流程示意图,包括步骤S201~S203,具体如下:
S201:根据所述知识图谱子图中的连接关系以及所述知识图谱嵌入模型,构建与所述知识图谱子图的连接关系相关联的知识图谱关系矩阵。
S202:根据所述头链接实体、连接关系、尾链接实体在所述知识图谱嵌入矩阵以及知识图谱关系矩阵中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组以及第二知识图谱集合组;
根据所述知识图谱子图中的连接关系以及链接实体,可以将所述链接实体划分为头链接实体以及尾链接实体。
在本实施例中,分析设备根据所述头链接实体在所述知识图谱嵌入矩阵中的索引,所述连接关系在所述知识图谱关系矩阵中的索引以及尾链接实体在所述知识图谱嵌入矩阵中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组,其中,为所述第一知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵中的索引序号,为所述第一知识图谱集合组中的连接关系在所述知识图谱关系矩阵中的索引序号,为所述第一知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵中的索引序号。
对所述知识图谱集合组中的头链接实体、连接关系以及尾链接实体进行随机替换,构建更新后的知识图谱集合组,即第二知识图谱集合组,其中,为所述第二知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵中的索引序号,为所述第二知识图谱集合组中的连接关系在所述知识图谱关系矩阵中的索引序号,为所述第二知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵中的索引序号。
S203:采用梯度下降方法,根据所述第一知识图谱集合组、第二知识图谱集合组以及预设的损失函数,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵。
在本实施例中,分析设备将所述知识图谱集合组S以及更新后的知识图谱集合组S’输入至损失函数中,采用梯度下降方法,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵,其中,所述损失函数为:
S3:根据所述摘要文本以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量。
所述训练语言模型为可以采用BERT(Bidirectional Encoder Representaionfrom Transformers)模型,也可以采用GloVe(Global Vector)模型。
在本实施例中,分析设备将所述知识图谱子图中的摘要文本输入至训练语言模型中,构建与所述知识图谱子图的摘要文本相关联的摘要特征向量矩阵,所述知识图谱关系矩阵包括若干个摘要特征向量,所述摘要特征向量矩阵为一个的矩阵,其中为所述知识图谱子图中链接实体的总数,为所述摘要特征向量的维度。
请参阅图4,图4为本申请另一个实施例提供的基于常识知识图谱的情感分析方法的流程示意图,包括步骤S6,所述步骤S6在步骤S4之前,具体如下:
S6:根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的标准化算法,获取标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵。
所述标准化算法为:
在本实施例中,分析设备根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的标准化算法,获取标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵,降低了矩阵后处理的复杂度,提高情感分析的精准性。
S4:根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量。
在本实施例中,分析设备根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量。
请参阅图5,图5为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S4的流程示意图,包括步骤S401~S402,具体如下:
S401:将所述标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵进行拼接,作为输入特征向量输入至所述图卷积神经网络模型。
在本实施例中,分析设备将所述获取的标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵进行拼接,作为输入特征向量输入至所述图卷积神经网络模型,所述输入特征向量为:
S402:构建目标邻接矩阵,根据所述输入特征向量、目标邻接矩阵以及实体更新算法,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量。
将所述输入特征向量、目标邻接矩阵输入至所述图卷积神经网络模型中的实体更新算法,获取与所述知识图谱子图相关联的常识特征向量。
所述实体更新算法为:
式中,为所述常识特征向量,为所述目标邻接矩阵的行数,为所述目标邻接矩阵的目标邻接向量,为所述图卷积神经网络模型中第k层网络的权重更新参数,为所述第j个链接实体在图卷积神经网络模型中第k层的节点的输入特征向量,为所述第j个链接实体在图卷积神经网络模型中第k层的节点的权重更新偏置项。
S5:获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
在本实施例中,分析设备获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
请参阅图6,图6为本申请第一实施例提供的基于常识知识图谱的情感分析方法中S5的流程示意图,包括步骤S501~S502,具体如下:
S501:将所述情感特征向量以及常识特征向量进行拼接,获取情感分析特征,将所述情感分析特征输入至所述情感分析算法中,获取情感分类极性概率分布向量。
所述情感分析算法为:
在本实施例中,分析设备将所述情感特征向量以及常识特征向量进行拼接,获取情感分析特征,利用softmax函数和单层感知机构建所述情感分析算法,将所述情感分析特征输入至所述情感分析算法中,获取情感分类极性概率分布向量。
S502:根据所述情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,作为所述待测文本数据集的情感分析结果。
在本实施例中,分析设备根据所述情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,作为所述待测文本数据集的情感分析结果,具体地,当计算得到=[积极,消极,中性]=[0.1,0.7,0.2],概率最大为消极,其概率最大的维度对应的情感极性为消极,作为所述待测文本数据集的情感分析结果。
在一个可选的实施例中,本申请还提供一种网络信息推荐方法,所述网络信息推荐方法应用了上述基于常识知识图谱的情感分析方法,首先获取社交网络平台上用户发表的评论信息,作为所述待测文本数据集,并构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图。根据本申请提供的所述基于常识知识图谱的情感分析方法,获得所述待测文本数据集的情感分析结果。并根据所述待测文本数据集的情感分析结果,获取情感极性为积极的待测句子及其对应的评论信息,获取发表所述评论信息的用户的用户标识,根据所述用户标识,向所述用户推送与情感极性为积极的所述待测句子相关联的网络信息。
在本实施例中,所述待测文本数据集是基于社交网络平台获取的数据集,例如Twitter、Youtube等社交网络平台,分析设备通过与所述社交网络平台进行连接,获取用户对某一服务或者产品发表的评论信息,作为所述待测文本数据集,并构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图。
当分析后获取所述待测文本数据集的情感分析结果后,分析设备根据所述情感分析结果获取其中情感极性为积极的待测句子,获取对应的用户发表的评论信息,以及对应的用户标识,向相应的用户推送相关联的网络信息,所述网络信息可以是相关的服务信息或者产品信息。
请参阅图7,图7为本申请一个实施例提供的基于常识知识图谱的情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现基于常识知识图谱的情感分析方法的全部或一部分,该装置7包括:
获取模块71,用于获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
知识图谱嵌入矩阵构建模块72,用于根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
摘要特征向量矩阵构建模块73,用于根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
常识特征向量获取模块74,用于根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
情感分析模块75,用于获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
在本申请的实施例中,通过获取模块,获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
通过知识图谱嵌入矩阵构建模块,根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;通过摘要特征向量矩阵构建模块,根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;通过常识特征向量获取模块,根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;通过情感分析模块,获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。本申请通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。
请参考图8,图8为本申请一个实施例提供的计算机设备的结构示意图,计算机设备8包括:处理器81、存储器82以及存储在存储器82上并可在处理器81上运行的计算机程序83;计算机设备可以存储有多条指令,指令适用于由处理器81加载并执行上述图1至图6所述实施例的方法步骤,具体执行过程可以参见图1至图6所述实施例的具体说明,在此不进行赘述。
其中,处理器81可以包括一个或多个处理核心。处理器81利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器82内的指令、程序、代码集或指令集,以及调用存储器82内的数据,执行基于常识知识图谱的情感分析装置6的各种功能和处理数据,可选的,处理器81可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrambleLogic Array,PLA)中的至少一个硬件形式来实现。处理器81可集成中央处理器81(CentralProcessing Unit,CPU)、图像处理器81(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器81中,单独通过一块芯片进行实现。
其中,存储器82可以包括随机存储器82(Random Access Memory,RAM),也可以包括只读存储器82(Read-Only Memory)。可选的,该存储器82包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器82可用于存储指令、程序、代码、代码集或指令集。存储器82可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器82可选的还可以是至少一个位于远离前述处理器81的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行所示实施例一至实施例三的方法步骤,具体执行过程可以参见所示图1至图6所述实施例的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。
Claims (8)
1.一种基于常识知识图谱的情感分析方法,其特征在于,包括以下步骤:
获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本,所述待测句子包括上文、与所述链接实体相关联的属性词以及下文,所述知识图谱子图还包括与所述待测句子相关联的各个链接实体彼此的连接关系,所述链接实体包括头链接实体以及尾链接实体;
根据所述连接关系以及预设的知识图谱嵌入模型,构建与所述知识图谱子图相关联的知识图谱关系矩阵;
根据所述头链接实体、连接关系、尾链接实体在所述知识图谱嵌入矩阵以及知识图谱关系矩阵中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组以及第二知识图谱集合组,所述第一知识图谱集合组为:
式中,为所述第一知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵中的索引序号,为所述第一知识图谱集合组中的连接关系在所述知识图谱关系矩阵中的索引序号,为所述第一知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵中的索引序号;
所述第二知识图谱集合组为:
式中,为所述第二知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵中的索引序号,为所述第二知识图谱集合组中的连接关系在所述知识图谱关系矩阵中的索引序号,为所述第二知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵中的索引序号;
采用梯度下降方法,根据第一知识图谱集合组、第二知识图谱集合组以及预设的损失函数,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量,所述损失函数为:
根据所述知识图谱子图以及预设的训练语言模型,获取与所述知识图谱子图中的摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
2.根据权利要求1所述的基于常识知识图谱的情感分析方法,其特征在于,所述构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,包括步骤:
根据所述待测句子中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量;
根据所述属性特征向量以及预设的知识图谱匹配池,从所述知识图谱匹配池中获取与所述待测句子相关联的链接实体,以及与所述链接实体对应的摘要文本,构建与所述待测句子相关联的知识图谱子图。
4.根据权利要求3所述的基于常识知识图谱的情感分析方法,其特征在于,所述根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量,包括步骤:
将所述标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵进行拼接,作为输入特征向量输入至所述图卷积神经网络模型;
构建目标邻接矩阵,所述目标邻接矩阵包括若干个目标邻接向量;根据所述输入特征向量、目标邻接矩阵以及实体更新算法,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量,其中,所述实体更新算法为:
6.一种基于常识知识图谱的情感分析装置,其特征在于,包括:
获取模块,用于获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本,所述待测句子包括上文、与所述链接实体相关联的属性词以及下文,所述知识图谱子图还包括与所述待测句子相关联的各个链接实体彼此的连接关系,所述链接实体包括头链接实体以及尾链接实体;
知识图谱关系矩阵构建模块,用于根据所述连接关系以及预设的知识图谱嵌入模型,构建与所述知识图谱子图相关联的知识图谱关系矩阵;
知识图谱集合组构建模块,用于根据所述头链接实体、连接关系、尾链接实体在所述知识图谱嵌入矩阵以及知识图谱关系矩阵中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组以及第二知识图谱集合组,所述第一知识图谱集合组为:
式中,为所述第一知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵中的索引序号,为所述第一知识图谱集合组中的连接关系在所述知识图谱关系矩阵中的索引序号,为所述第一知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵中的索引序号;
所述第二知识图谱集合组为:
式中,为所述第二知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵中的索引序号,为所述第二知识图谱集合组中的连接关系在所述知识图谱关系矩阵中的索引序号,为所述第二知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵中的索引序号;
知识图谱关系矩阵更新模块,用于采用梯度下降方法,根据第一知识图谱集合组、第二知识图谱集合组以及预设的损失函数,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量,所述损失函数为:
摘要特征向量矩阵构建模块,用于根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
常识特征向量获取模块,用于根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
情感分析模块,用于获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
7.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的基于常识知识图谱的情感分析方法的步骤。
8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的基于常识知识图谱的情感分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210360819.3A CN114547312B (zh) | 2022-04-07 | 2022-04-07 | 基于常识知识图谱的情感分析方法、装置以及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210360819.3A CN114547312B (zh) | 2022-04-07 | 2022-04-07 | 基于常识知识图谱的情感分析方法、装置以及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114547312A CN114547312A (zh) | 2022-05-27 |
CN114547312B true CN114547312B (zh) | 2022-08-16 |
Family
ID=81664714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210360819.3A Active CN114547312B (zh) | 2022-04-07 | 2022-04-07 | 基于常识知识图谱的情感分析方法、装置以及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114547312B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115905518B (zh) * | 2022-10-17 | 2023-10-20 | 华南师范大学 | 基于知识图谱的情感分类方法、装置、设备以及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190122111A1 (en) * | 2017-10-24 | 2019-04-25 | Nec Laboratories America, Inc. | Adaptive Convolutional Neural Knowledge Graph Learning System Leveraging Entity Descriptions |
CN109902171B (zh) * | 2019-01-30 | 2020-12-25 | 中国地质大学(武汉) | 基于分层知识图谱注意力模型的文本关系抽取方法及系统 |
CN111538835B (zh) * | 2020-03-30 | 2023-05-23 | 东南大学 | 一种基于知识图谱的社交媒体情感分类方法与装置 |
CN111524593B (zh) * | 2020-04-23 | 2022-08-16 | 厦门大学 | 基于上下文语言模型和知识嵌入的医疗问答方法及系统 |
CN113553424A (zh) * | 2020-04-26 | 2021-10-26 | 阿里巴巴集团控股有限公司 | 数据处理方法、装置及设备及事件抽取模型的生成方法 |
CN113435211B (zh) * | 2021-07-19 | 2022-07-19 | 北京理工大学 | 一种结合外部知识的文本隐式情感分析方法 |
CN113688212B (zh) * | 2021-10-27 | 2022-02-08 | 华南师范大学 | 句子情感分析方法、装置以及设备 |
-
2022
- 2022-04-07 CN CN202210360819.3A patent/CN114547312B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114547312A (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110532571A (zh) | 文本处理方法及相关装置 | |
CN113705772A (zh) | 一种模型训练方法、装置、设备及可读存储介质 | |
Jolly | Machine learning with scikit-learn quick start guide: classification, regression, and clustering techniques in Python | |
CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
CN114676704A (zh) | 句子情感分析方法、装置、设备以及存储介质 | |
CN112182362A (zh) | 训练用于在线预测点击率的模型的方法、设备及推荐系统 | |
CN109992676B (zh) | 一种跨媒体资源检索方法及检索系统 | |
CN110874439A (zh) | 一种基于评论信息的推荐方法 | |
CN113688212B (zh) | 句子情感分析方法、装置以及设备 | |
CN116258145B (zh) | 多模态命名实体识别方法、装置、设备以及存储介质 | |
CN115587597B (zh) | 基于子句级关系图的方面词的情感分析方法以及装置 | |
US20220075955A1 (en) | Neural network training method and apparatus, semantic classification method and apparatus and medium | |
CN114564593A (zh) | 多模态知识图谱的补全方法、装置和电子设备 | |
CN110377733A (zh) | 一种基于文本的情绪识别方法、终端设备及介质 | |
CN113722583A (zh) | 推荐方法、推荐模型训练方法及相关产品 | |
CN116151263B (zh) | 多模态命名实体识别方法、装置、设备以及存储介质 | |
CN114547312B (zh) | 基于常识知识图谱的情感分析方法、装置以及设备 | |
JP7081454B2 (ja) | 処理装置、処理方法、及び処理プログラム | |
Qureshi et al. | Performance evaluation of machine learning models on large dataset of android applications reviews | |
CN115905518B (zh) | 基于知识图谱的情感分类方法、装置、设备以及存储介质 | |
CN115659987B (zh) | 基于双通道的多模态命名实体识别方法、装置以及设备 | |
CN115659951B (zh) | 基于标签嵌入的语句情感分析方法、装置以及设备 | |
CN115905524B (zh) | 融合句法和语义信息的情感分析方法、装置以及设备 | |
CN115206421B (zh) | 药物重定位方法、重定位模型的训练方法及装置 | |
CN116701935A (zh) | 敏感度预测模型训练方法、敏感信息处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |