CN114547312B - 基于常识知识图谱的情感分析方法、装置以及设备 - Google Patents

基于常识知识图谱的情感分析方法、装置以及设备 Download PDF

Info

Publication number
CN114547312B
CN114547312B CN202210360819.3A CN202210360819A CN114547312B CN 114547312 B CN114547312 B CN 114547312B CN 202210360819 A CN202210360819 A CN 202210360819A CN 114547312 B CN114547312 B CN 114547312B
Authority
CN
China
Prior art keywords
knowledge
graph
matrix
feature vector
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210360819.3A
Other languages
English (en)
Other versions
CN114547312A (zh
Inventor
卢国钧
薛云
余海波
蔡倩华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202210360819.3A priority Critical patent/CN114547312B/zh
Publication of CN114547312A publication Critical patent/CN114547312A/zh
Application granted granted Critical
Publication of CN114547312B publication Critical patent/CN114547312B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及情感分析领域,特别涉及一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质,通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。

Description

基于常识知识图谱的情感分析方法、装置以及设备
技术领域
本发明涉及情感分析领域,特别涉及一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质。
背景技术
如今,人们可以随时通过社交网站、博客或电商平台发表评论以表达他们对各种服务或产品的想法,这些在线评论影响着未来消费者的购买决策,同时也正成为衡量企业质量的重要的标准。为了给企业带来更高的收益,一个更为有效的情感分析方法也越来越被视为一项至关重要的任务。
目前的技术方案,通过采用计算模型分析文本语句中关于某一特定的主题、服务、或产品的观点是正面的、中性的、还是负面的,有针对性对用户的情感进行分析。其中一个重要的解决方案是细粒度情感分类(Aspect-level sentiment classification,ALSC),即利用计算模型分析文本语句中关于某一特定的主题、服务、或产品的观点是正面的、中性的、还是负面的。然而现有的技术方案仅仅关注于在线评论的文本语句的上下文信息,无法准确地对文本语句进行准确的情感分析。
发明内容
基于此,本发明提供一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质,通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。
该技术方法如下:
第一方面,本申请实施例提供了一种基于常识知识图谱的情感分析方法,包括以下步骤:
获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
第二方面,本申请实施例提供了一种基于常识知识图谱的情感分析装置,包括:
获取模块,用于获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
知识图谱嵌入矩阵构建模块,用于根据所述链接实体以及预设的知识图谱嵌入模型,获取与所述链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
摘要特征向量矩阵构建模块,用于根据所述摘要文本以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
常识特征向量获取模块,用于根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
情感分析模块,用于获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的基于常识知识图谱的情感分析方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于常识知识图谱的情感分析方法的步骤。
在本实施例中,提供一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质,通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请第一实施例提供的基于常识知识图谱的情感分析方法的流程示意图;
图2为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S1的流程示意图;
图3为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S2的流程示意图;
图4为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S4的流程示意图;
图5为本申请另一个实施例提供的基于常识知识图谱的情感分析方法的流程示意图;
图6为本申请第一实施例提供的基于常识知识图谱的情感分析方法中S5的流程示意图;
图7为本申请一个实施例提供的基于常识知识图谱的情感分析装置的结构示意图;
图8为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请第一实施例提供的基于常识知识图谱的情感分析方法的流程示意图,包括如下步骤:
S1:获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图。
本申请的基于常识知识图谱的情感分析方法的执行主体为基于常识知识图谱的情感分析方法的分析设备(以下简称分析设备)。
在一个可选的实施例中,分析设备可以是一台计算机设备,可以是服务器,或多台计算机设备联合而成的服务器机群。
每一个待测文本数据集包含若干个待测句子以及标记好的待测句子中的上文、属性词以及下文的位置,所述待测句子包括上文、与所述链接实体相关联的属性词以及下文,所述属性词为待测句子中所描述的某一实体,可以是名词。
在一个可选的实施例中,所述待测文本数据集可以是SemEval2014中的Restaurant和Laptop14数据集,分析设备可以获取用户输入的待测文本数据集,并构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体、与所述链接实体对应的摘要文本以及与所述待测句子相关联的各个链接实体彼此的连接关系,所述链接实体包括头链接实体以及尾链接实体。
请参阅图2,图2为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S1的流程示意图,包括步骤S101~S102,具体如下:
S101:根据所述待测句子中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量。
所述双向编码器由一个预训练语言模型以及三个双向LSTM网络组成,所述预训练语言模型可以采用BERT(Bidirectional Encoder Representaion from Transformers)模型,也可以采用GloVe(Global Vector)模型。
在本实施例中,分析设备采用BERT模型作为所述预训练语言模型,将所述待测句子输入至所述BERT模型,获取所述BERT模型输出的待测句子的每一个词对应的特征,具体如下:
控制设备分别将上文,属性词,下文输入至所述BERT模型得到上文词特征矩阵C1,属性词词特征矩阵C2,下文词特征矩阵C3,其中,C1为
Figure 546577DEST_PATH_IMAGE001
矩阵,C2为
Figure 469534DEST_PATH_IMAGE002
矩阵,C3为
Figure 982555DEST_PATH_IMAGE003
矩阵,
Figure 459803DEST_PATH_IMAGE004
为上文中词的总数,
Figure 44369DEST_PATH_IMAGE005
为属性词中词的总数,
Figure 290673DEST_PATH_IMAGE006
为下文中词的总数。
Figure 302492DEST_PATH_IMAGE007
为BERT模型的输出特征维度;
将所述上文词特征矩阵C1输入至所述第一双向LSTM网络中得到上文隐藏层特征
Figure 1457DEST_PATH_IMAGE008
,将所述属性词特征矩阵C2输入至所述第二双向LSTM网络中得到属性词隐藏层特征
Figure 389713DEST_PATH_IMAGE009
,将所述下文词特征矩阵C3输入至所述第三双向LSTM网络中得到下文隐藏层特征
Figure 490524DEST_PATH_IMAGE010
将上文隐藏层特征
Figure 673244DEST_PATH_IMAGE008
与下文隐藏层特征
Figure 452981DEST_PATH_IMAGE010
相加后得到上下文隐藏层特
Figure 254715DEST_PATH_IMAGE011
;将上下文隐藏层特征
Figure 6771DEST_PATH_IMAGE011
与属性词隐藏层特征
Figure 829233DEST_PATH_IMAGE009
进行哈达玛积得到属性词特征向量
Figure 627425DEST_PATH_IMAGE012
所述特征
Figure 232850DEST_PATH_IMAGE013
均为
Figure 167308DEST_PATH_IMAGE014
维向量,
Figure 98354DEST_PATH_IMAGE015
为双向LSTM网络的输出特征维度。所述哈达玛积运算方式为对两特征中每个数值逐个相乘获得新特征。
在本实施例中,分析设备根据所述待测句子中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量。
S102:根据所述属性特征向量以及预设的知识图谱匹配池,从所述知识图谱匹配池中获取与所述待测句子相关联的链接实体,以及与所述链接实体对应的摘要文本,构建与所述待测句子相关联的知识图谱子图。
所述知识图谱匹配池为一个
Figure 383842DEST_PATH_IMAGE016
矩阵
Figure 527379DEST_PATH_IMAGE017
,其中,
Figure 785185DEST_PATH_IMAGE017
的第i行向量
Figure 746188DEST_PATH_IMAGE018
代表第i个实体的特征。
属性特征向量与第i个实体的匹配度计算方式为
Figure 394338DEST_PATH_IMAGE019
,计算属性特征向量与所述知识图谱匹配池中所有实体计算匹配度,匹配度最高的实体即为属性词的链接实体。
在本实施例中,分析设备将所述属性特征向量输入至在所述知识图谱匹配池,将所述属性特征向量与所述知识图谱匹配池中的实体进行匹配,获取属性特征向量与各个实体对应的匹配度,将匹配度最高的实体作为与所述待测句子相关联的链接实体。
根据所述链接实体,从所述知识图谱匹配池中获取与所述链接实体对应的摘要文本以及与所述待测句子相关联的各个链接实体彼此的连接关系,构建与所述待测句子相关联的知识图谱子图。
S2:根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵。
所述知识图谱嵌入模型是应用于知识图谱的神经网络模型。其目标是为知识图谱中每个实体、关系计算出一种特征向量,使得知识图谱可以利用该特征向量来进行表示。
在本实施例中,分析设备将所述知识图谱子图输入至知识图谱嵌入模型中,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵
Figure 466199DEST_PATH_IMAGE020
,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量。
所述知识图谱嵌入矩阵为一个
Figure 844091DEST_PATH_IMAGE021
的矩阵,其中
Figure 579922DEST_PATH_IMAGE022
为所述知识图谱子图中链接实体的总数,
Figure 105582DEST_PATH_IMAGE023
为所述链接实体嵌入向量的维度,
Figure 590921DEST_PATH_IMAGE024
为所述知识图谱嵌入矩阵中第i行的链接实体嵌入向量。
请参阅图3,图3为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S2的流程示意图,包括步骤S201~S203,具体如下:
S201:根据所述知识图谱子图中的连接关系以及所述知识图谱嵌入模型,构建与所述知识图谱子图的连接关系相关联的知识图谱关系矩阵。
在本实施例中,分析设备将所述知识图谱子图中的连接关系输入至知识图谱嵌入模型中,构建与所述知识图谱子图的连接关系相关联的知识图谱关系矩阵
Figure 823319DEST_PATH_IMAGE025
,所述知识图谱关系矩阵包括若干个连接关系特征向量。
所述知识图谱关系矩阵为一个
Figure 860545DEST_PATH_IMAGE026
的矩阵,其中
Figure 748867DEST_PATH_IMAGE027
为所述知识图谱子图中连接关系的总数,
Figure 162530DEST_PATH_IMAGE028
为所述连接关系特征向量的维度,
Figure 921539DEST_PATH_IMAGE029
为所述知识图谱关系矩阵中第i行的连接关系特征向量。
S202:根据所述头链接实体、连接关系、尾链接实体在所述知识图谱嵌入矩阵以及知识图谱关系矩阵中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组以及第二知识图谱集合组;
根据所述知识图谱子图中的连接关系以及链接实体,可以将所述链接实体划分为头链接实体以及尾链接实体。
在本实施例中,分析设备根据所述头链接实体在所述知识图谱嵌入矩阵
Figure 598508DEST_PATH_IMAGE030
中的索引,所述连接关系在所述知识图谱关系矩阵
Figure 567601DEST_PATH_IMAGE025
中的索引以及尾链接实体在所述知识图谱嵌入矩阵
Figure 660322DEST_PATH_IMAGE031
中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组
Figure 664050DEST_PATH_IMAGE032
,其中,
Figure 246341DEST_PATH_IMAGE033
为所述第一知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵
Figure 578096DEST_PATH_IMAGE031
中的索引序号,
Figure 333563DEST_PATH_IMAGE034
为所述第一知识图谱集合组中的连接关系在所述知识图谱关系矩阵
Figure 332743DEST_PATH_IMAGE025
中的索引序号,
Figure 148252DEST_PATH_IMAGE035
为所述第一知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵
Figure 295200DEST_PATH_IMAGE031
中的索引序号。
对所述知识图谱集合组中的头链接实体、连接关系以及尾链接实体进行随机替换,构建更新后的知识图谱集合组,即第二知识图谱集合组
Figure 464144DEST_PATH_IMAGE036
,其中,
Figure 442464DEST_PATH_IMAGE037
为所述第二知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵
Figure 304241DEST_PATH_IMAGE030
中的索引序号,
Figure 938485DEST_PATH_IMAGE038
为所述第二知识图谱集合组中的连接关系在所述知识图谱关系矩阵
Figure 35754DEST_PATH_IMAGE025
中的索引序号,
Figure 478368DEST_PATH_IMAGE039
为所述第二知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵
Figure 901259DEST_PATH_IMAGE030
中的索引序号。
S203:采用梯度下降方法,根据所述第一知识图谱集合组、第二知识图谱集合组以及预设的损失函数,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵。
在本实施例中,分析设备将所述知识图谱集合组S以及更新后的知识图谱集合组S’输入至损失函数中,采用梯度下降方法,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵,其中,所述损失函数为:
Figure 694902DEST_PATH_IMAGE040
式中,
Figure 533545DEST_PATH_IMAGE041
为所述损失函数,
Figure 220879DEST_PATH_IMAGE042
为知识图谱嵌入目标函数,所述知识图谱嵌入目标函数
Figure 424458DEST_PATH_IMAGE043
,其中,所述知识图谱嵌入目标函数
Figure 830031DEST_PATH_IMAGE043
可以等于包括但不限于
Figure 410048DEST_PATH_IMAGE044
或者
Figure 951888DEST_PATH_IMAGE045
,为矩阵的哈达玛积。
S3:根据所述摘要文本以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量。
所述训练语言模型为可以采用BERT(Bidirectional Encoder Representaionfrom Transformers)模型,也可以采用GloVe(Global Vector)模型。
在本实施例中,分析设备将所述知识图谱子图中的摘要文本输入至训练语言模型中,构建与所述知识图谱子图的摘要文本相关联的摘要特征向量矩阵
Figure 156922DEST_PATH_IMAGE047
,所述知识图谱关系矩阵包括若干个摘要特征向量,所述摘要特征向量矩阵为一个
Figure 134105DEST_PATH_IMAGE048
的矩阵,其中
Figure 671397DEST_PATH_IMAGE049
为所述知识图谱子图中链接实体的总数,
Figure 606992DEST_PATH_IMAGE050
为所述摘要特征向量的维度。
请参阅图4,图4为本申请另一个实施例提供的基于常识知识图谱的情感分析方法的流程示意图,包括步骤S6,所述步骤S6在步骤S4之前,具体如下:
S6:根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的标准化算法,获取标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵。
所述标准化算法为:
Figure 596944DEST_PATH_IMAGE051
式中,
Figure 581081DEST_PATH_IMAGE047
为所述摘要特征向量矩阵,
Figure 97513DEST_PATH_IMAGE052
为所述标准化处理后的摘要特征向量矩阵,
Figure 807937DEST_PATH_IMAGE053
为所述知识图谱嵌入矩阵,
Figure 675399DEST_PATH_IMAGE054
为所述标准化处理后的知识图谱嵌入矩阵,
Figure 135330DEST_PATH_IMAGE055
为数学期望函数,
Figure 709531DEST_PATH_IMAGE056
为方差计算函数,
Figure 721349DEST_PATH_IMAGE057
为正数,通常为
Figure 685894DEST_PATH_IMAGE058
在本实施例中,分析设备根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的标准化算法,获取标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵,降低了矩阵后处理的复杂度,提高情感分析的精准性。
S4:根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量。
在本实施例中,分析设备根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量。
请参阅图5,图5为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S4的流程示意图,包括步骤S401~S402,具体如下:
S401:将所述标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵进行拼接,作为输入特征向量输入至所述图卷积神经网络模型。
在本实施例中,分析设备将所述获取的标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵进行拼接,作为输入特征向量输入至所述图卷积神经网络模型,所述输入特征向量为:
Figure 74150DEST_PATH_IMAGE059
式中,
Figure 502857DEST_PATH_IMAGE060
为所述输入特征向量,
Figure 560943DEST_PATH_IMAGE061
为所述标准化处理后的摘要特征向量矩阵中第i行摘要特征向量,
Figure 402997DEST_PATH_IMAGE062
为所述标准化处理后的知识图谱嵌入矩阵中第i行链接实体嵌入向量。
S402:构建目标邻接矩阵,根据所述输入特征向量、目标邻接矩阵以及实体更新算法,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量。
在本实施例中,分析设备采用所述图卷积神经网络模型,构建与所述知识图谱子图的邻接矩阵
Figure 204731DEST_PATH_IMAGE063
,以表示所述知识图谱子图中各链接实体间的连接关系,其中,所述目标邻接矩阵包括若干个目标邻接向量;
所述邻接矩阵
Figure 487945DEST_PATH_IMAGE064
为一个
Figure 107145DEST_PATH_IMAGE065
Figure 46282DEST_PATH_IMAGE065
列的矩阵,
Figure 510762DEST_PATH_IMAGE066
为所述目标邻接矩阵的目标邻接向量,当
Figure 586165DEST_PATH_IMAGE067
,代表链接实体i和链接实体j相连,反之,当
Figure 579529DEST_PATH_IMAGE068
,代表链接实体i和链接实体j不具有连接关系相连。
分析设备将所述邻接矩阵
Figure 599438DEST_PATH_IMAGE069
进行标准化,获得标准化后的目标邻接矩阵
Figure 274132DEST_PATH_IMAGE070
,其中,
Figure 328676DEST_PATH_IMAGE071
为所述邻接矩阵
Figure 227362DEST_PATH_IMAGE064
的度矩阵,
Figure 875512DEST_PATH_IMAGE072
Figure 212953DEST_PATH_IMAGE073
Figure 997369DEST_PATH_IMAGE074
以及
Figure 129273DEST_PATH_IMAGE075
为所述邻接矩阵
Figure 327036DEST_PATH_IMAGE064
的度矩阵的特征向量。
将所述输入特征向量、目标邻接矩阵输入至所述图卷积神经网络模型中的实体更新算法,获取与所述知识图谱子图相关联的常识特征向量。
所述实体更新算法为:
Figure 77955DEST_PATH_IMAGE076
式中,
Figure 372670DEST_PATH_IMAGE077
为所述常识特征向量,
Figure 285262DEST_PATH_IMAGE078
为所述目标邻接矩阵的行数,
Figure 235900DEST_PATH_IMAGE079
为所述目标邻接矩阵的目标邻接向量,
Figure 649564DEST_PATH_IMAGE080
为所述图卷积神经网络模型中第k层网络的权重更新参数,
Figure 674152DEST_PATH_IMAGE081
为所述第j个链接实体在图卷积神经网络模型中第k层的节点的输入特征向量,
Figure 23225DEST_PATH_IMAGE082
为所述第j个链接实体在图卷积神经网络模型中第k层的节点的权重更新偏置项。
S5:获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
在本实施例中,分析设备获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
请参阅图6,图6为本申请第一实施例提供的基于常识知识图谱的情感分析方法中S5的流程示意图,包括步骤S501~S502,具体如下:
S501:将所述情感特征向量以及常识特征向量进行拼接,获取情感分析特征,将所述情感分析特征输入至所述情感分析算法中,获取情感分类极性概率分布向量。
所述情感分析算法为:
Figure 992318DEST_PATH_IMAGE083
式中,
Figure 350618DEST_PATH_IMAGE084
为所述情感分类极性概率分布向量,
Figure 88767DEST_PATH_IMAGE085
为单层感知机的权重更新参数,
Figure 874320DEST_PATH_IMAGE086
为单层感知机的权重更新偏置项,
Figure 223654DEST_PATH_IMAGE087
为所述情感分析特征;
Figure 979120DEST_PATH_IMAGE088
为归一化指数函数,其中,
Figure 712721DEST_PATH_IMAGE089
式中,
Figure 793810DEST_PATH_IMAGE090
Figure 347282DEST_PATH_IMAGE091
维向量,
Figure 109701DEST_PATH_IMAGE090
Figure 822442DEST_PATH_IMAGE092
函数的输入,
Figure 684219DEST_PATH_IMAGE090
Figure 380780DEST_PATH_IMAGE093
Figure 353415DEST_PATH_IMAGE094
个标量组成,
Figure 123925DEST_PATH_IMAGE095
代表
Figure 281237DEST_PATH_IMAGE090
i维的数值。经过softmax函数的计算后得到的最终向量同为
Figure 809301DEST_PATH_IMAGE096
维向量,具体如下:
Figure 975840DEST_PATH_IMAGE097
在本实施例中,分析设备将所述情感特征向量以及常识特征向量进行拼接,获取情感分析特征
Figure 538540DEST_PATH_IMAGE087
,利用softmax函数和单层感知机构建所述情感分析算法,将所述情感分析特征输入至所述情感分析算法中,获取情感分类极性概率分布向量。
S502:根据所述情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,作为所述待测文本数据集的情感分析结果。
在本实施例中,分析设备根据所述情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,作为所述待测文本数据集的情感分析结果,具体地,当计算得到
Figure 70015DEST_PATH_IMAGE084
=[
Figure 210010DEST_PATH_IMAGE084
积极,
Figure 790027DEST_PATH_IMAGE084
消极,
Figure 331866DEST_PATH_IMAGE084
中性]=[0.1,0.7,0.2],概率最大为
Figure 34243DEST_PATH_IMAGE084
消极,其概率最大的维度对应的情感极性为消极,作为所述待测文本数据集的情感分析结果。
在一个可选的实施例中,本申请还提供一种网络信息推荐方法,所述网络信息推荐方法应用了上述基于常识知识图谱的情感分析方法,首先获取社交网络平台上用户发表的评论信息,作为所述待测文本数据集,并构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图。根据本申请提供的所述基于常识知识图谱的情感分析方法,获得所述待测文本数据集的情感分析结果。并根据所述待测文本数据集的情感分析结果,获取情感极性为积极的待测句子及其对应的评论信息,获取发表所述评论信息的用户的用户标识,根据所述用户标识,向所述用户推送与情感极性为积极的所述待测句子相关联的网络信息。
在本实施例中,所述待测文本数据集是基于社交网络平台获取的数据集,例如Twitter、Youtube等社交网络平台,分析设备通过与所述社交网络平台进行连接,获取用户对某一服务或者产品发表的评论信息,作为所述待测文本数据集,并构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图。
当分析后获取所述待测文本数据集的情感分析结果后,分析设备根据所述情感分析结果获取其中情感极性为积极的待测句子,获取对应的用户发表的评论信息,以及对应的用户标识,向相应的用户推送相关联的网络信息,所述网络信息可以是相关的服务信息或者产品信息。
请参阅图7,图7为本申请一个实施例提供的基于常识知识图谱的情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现基于常识知识图谱的情感分析方法的全部或一部分,该装置7包括:
获取模块71,用于获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
知识图谱嵌入矩阵构建模块72,用于根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
摘要特征向量矩阵构建模块73,用于根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
常识特征向量获取模块74,用于根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
情感分析模块75,用于获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
在本申请的实施例中,通过获取模块,获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
通过知识图谱嵌入矩阵构建模块,根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;通过摘要特征向量矩阵构建模块,根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;通过常识特征向量获取模块,根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;通过情感分析模块,获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。本申请通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。
请参考图8,图8为本申请一个实施例提供的计算机设备的结构示意图,计算机设备8包括:处理器81、存储器82以及存储在存储器82上并可在处理器81上运行的计算机程序83;计算机设备可以存储有多条指令,指令适用于由处理器81加载并执行上述图1至图6所述实施例的方法步骤,具体执行过程可以参见图1至图6所述实施例的具体说明,在此不进行赘述。
其中,处理器81可以包括一个或多个处理核心。处理器81利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器82内的指令、程序、代码集或指令集,以及调用存储器82内的数据,执行基于常识知识图谱的情感分析装置6的各种功能和处理数据,可选的,处理器81可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrambleLogic Array,PLA)中的至少一个硬件形式来实现。处理器81可集成中央处理器81(CentralProcessing Unit,CPU)、图像处理器81(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器81中,单独通过一块芯片进行实现。
其中,存储器82可以包括随机存储器82(Random Access Memory,RAM),也可以包括只读存储器82(Read-Only Memory)。可选的,该存储器82包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器82可用于存储指令、程序、代码、代码集或指令集。存储器82可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器82可选的还可以是至少一个位于远离前述处理器81的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行所示实施例一至实施例三的方法步骤,具体执行过程可以参见所示图1至图6所述实施例的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。

Claims (8)

1.一种基于常识知识图谱的情感分析方法,其特征在于,包括以下步骤:
获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本,所述待测句子包括上文、与所述链接实体相关联的属性词以及下文,所述知识图谱子图还包括与所述待测句子相关联的各个链接实体彼此的连接关系,所述链接实体包括头链接实体以及尾链接实体;
根据所述连接关系以及预设的知识图谱嵌入模型,构建与所述知识图谱子图相关联的知识图谱关系矩阵;
根据所述头链接实体、连接关系、尾链接实体在所述知识图谱嵌入矩阵以及知识图谱关系矩阵中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组以及第二知识图谱集合组,所述第一知识图谱集合组为:
Figure 15042DEST_PATH_IMAGE001
式中,
Figure 338707DEST_PATH_IMAGE002
为所述第一知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵
Figure 852865DEST_PATH_IMAGE003
中的索引序号,
Figure 779232DEST_PATH_IMAGE004
为所述第一知识图谱集合组中的连接关系在所述知识图谱关系矩阵
Figure 265708DEST_PATH_IMAGE005
中的索引序号,
Figure 619329DEST_PATH_IMAGE006
为所述第一知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵
Figure 620783DEST_PATH_IMAGE007
中的索引序号;
所述第二知识图谱集合组为:
Figure 226208DEST_PATH_IMAGE008
式中,
Figure 691825DEST_PATH_IMAGE009
为所述第二知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵
Figure 91713DEST_PATH_IMAGE007
中的索引序号,
Figure 580463DEST_PATH_IMAGE010
为所述第二知识图谱集合组中的连接关系在所述知识图谱关系矩阵
Figure 848634DEST_PATH_IMAGE005
中的索引序号,
Figure 44123DEST_PATH_IMAGE011
为所述第二知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵
Figure 5125DEST_PATH_IMAGE007
中的索引序号;
采用梯度下降方法,根据第一知识图谱集合组、第二知识图谱集合组以及预设的损失函数,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量,所述损失函数为:
Figure 981172DEST_PATH_IMAGE012
式中,
Figure 656960DEST_PATH_IMAGE013
为所述损失函数,
Figure 97169DEST_PATH_IMAGE014
为知识图谱嵌入目标函数;
根据所述知识图谱子图以及预设的训练语言模型,获取与所述知识图谱子图中的摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
2.根据权利要求1所述的基于常识知识图谱的情感分析方法,其特征在于,所述构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,包括步骤:
根据所述待测句子中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量;
根据所述属性特征向量以及预设的知识图谱匹配池,从所述知识图谱匹配池中获取与所述待测句子相关联的链接实体,以及与所述链接实体对应的摘要文本,构建与所述待测句子相关联的知识图谱子图。
3.根据权利要求1所述的基于常识知识图谱的情感分析方法,其特征在于,所述根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量之前,包括步骤:
根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的标准化算法,获取标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵,其中,所述标准化算法为:
Figure 838860DEST_PATH_IMAGE015
式中,
Figure 302203DEST_PATH_IMAGE016
为所述摘要特征向量矩阵,
Figure 912175DEST_PATH_IMAGE017
为所述标准化处理后的摘要特征向量矩阵,
Figure 82257DEST_PATH_IMAGE007
为所述知识图谱嵌入矩阵,
Figure 385062DEST_PATH_IMAGE018
为所述标准化处理后的知识图谱嵌入矩阵,
Figure 70121DEST_PATH_IMAGE019
为数学期望函数,
Figure 359151DEST_PATH_IMAGE020
为方差计算函数,
Figure 508373DEST_PATH_IMAGE021
为正数。
4.根据权利要求3所述的基于常识知识图谱的情感分析方法,其特征在于,所述根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量,包括步骤:
将所述标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵进行拼接,作为输入特征向量输入至所述图卷积神经网络模型;
构建目标邻接矩阵,所述目标邻接矩阵包括若干个目标邻接向量;根据所述输入特征向量、目标邻接矩阵以及实体更新算法,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量,其中,所述实体更新算法为:
Figure 857446DEST_PATH_IMAGE022
式中,
Figure 29801DEST_PATH_IMAGE023
为所述常识特征向量,
Figure 247156DEST_PATH_IMAGE024
为所述目标邻接矩阵的行数,
Figure 126250DEST_PATH_IMAGE025
为所述目标邻接矩阵的目标邻接向量,
Figure 770858DEST_PATH_IMAGE026
为所述图卷积神经网络模型中第k层网络的权重更新参数,
Figure 430510DEST_PATH_IMAGE027
为第j个链接实体在图卷积神经网络模型中第k层的节点的输入特征向量,
Figure 326921DEST_PATH_IMAGE028
为所述第j个链接实体在图卷积神经网络模型中第k层的节点的权重更新偏置项。
5.根据权利要求1所述的基于常识知识图谱的情感分析方法,其特征在于,所述根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果,包括步骤:
将所述情感分析特征输入至所述情感分析算法中,获取情感分类极性概率分布向量,其中,所述情感分析算法为:
Figure 919577DEST_PATH_IMAGE029
式中,
Figure 938348DEST_PATH_IMAGE030
为所述情感分类极性概率分布向量,
Figure 757400DEST_PATH_IMAGE031
为归一化指数函数,
Figure 582136DEST_PATH_IMAGE032
为单层感知机的权重更新参数,
Figure 170244DEST_PATH_IMAGE033
为单层感知机的权重更新偏置项,
Figure 94337DEST_PATH_IMAGE034
为所述情感分析特征;
根据所述情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,将所述情感极性作为所述待测文本数据集的情感分析结果,其中,所述情感极性包括积极、中性以及消极。
6.一种基于常识知识图谱的情感分析装置,其特征在于,包括:
获取模块,用于获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本,所述待测句子包括上文、与所述链接实体相关联的属性词以及下文,所述知识图谱子图还包括与所述待测句子相关联的各个链接实体彼此的连接关系,所述链接实体包括头链接实体以及尾链接实体;
知识图谱关系矩阵构建模块,用于根据所述连接关系以及预设的知识图谱嵌入模型,构建与所述知识图谱子图相关联的知识图谱关系矩阵;
知识图谱集合组构建模块,用于根据所述头链接实体、连接关系、尾链接实体在所述知识图谱嵌入矩阵以及知识图谱关系矩阵中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组以及第二知识图谱集合组,所述第一知识图谱集合组为:
Figure 525319DEST_PATH_IMAGE001
式中,
Figure 763533DEST_PATH_IMAGE002
为所述第一知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵
Figure 596360DEST_PATH_IMAGE003
中的索引序号,
Figure 894617DEST_PATH_IMAGE004
为所述第一知识图谱集合组中的连接关系在所述知识图谱关系矩阵
Figure 688261DEST_PATH_IMAGE005
中的索引序号,
Figure 589221DEST_PATH_IMAGE006
为所述第一知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵
Figure 214237DEST_PATH_IMAGE007
中的索引序号;
所述第二知识图谱集合组为:
Figure 417817DEST_PATH_IMAGE008
式中,
Figure 823390DEST_PATH_IMAGE009
为所述第二知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵
Figure 403407DEST_PATH_IMAGE007
中的索引序号,
Figure 148509DEST_PATH_IMAGE010
为所述第二知识图谱集合组中的连接关系在所述知识图谱关系矩阵
Figure 647624DEST_PATH_IMAGE005
中的索引序号,
Figure 415860DEST_PATH_IMAGE011
为所述第二知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵
Figure 658622DEST_PATH_IMAGE007
中的索引序号;
知识图谱关系矩阵更新模块,用于采用梯度下降方法,根据第一知识图谱集合组、第二知识图谱集合组以及预设的损失函数,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量,所述损失函数为:
Figure 258231DEST_PATH_IMAGE012
式中,
Figure 69192DEST_PATH_IMAGE013
为所述损失函数,
Figure 183778DEST_PATH_IMAGE035
为知识图谱嵌入目标函数;
摘要特征向量矩阵构建模块,用于根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
常识特征向量获取模块,用于根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
情感分析模块,用于获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
7.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述的基于常识知识图谱的情感分析方法的步骤。
8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的基于常识知识图谱的情感分析方法的步骤。
CN202210360819.3A 2022-04-07 2022-04-07 基于常识知识图谱的情感分析方法、装置以及设备 Active CN114547312B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210360819.3A CN114547312B (zh) 2022-04-07 2022-04-07 基于常识知识图谱的情感分析方法、装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210360819.3A CN114547312B (zh) 2022-04-07 2022-04-07 基于常识知识图谱的情感分析方法、装置以及设备

Publications (2)

Publication Number Publication Date
CN114547312A CN114547312A (zh) 2022-05-27
CN114547312B true CN114547312B (zh) 2022-08-16

Family

ID=81664714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210360819.3A Active CN114547312B (zh) 2022-04-07 2022-04-07 基于常识知识图谱的情感分析方法、装置以及设备

Country Status (1)

Country Link
CN (1) CN114547312B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905518B (zh) * 2022-10-17 2023-10-20 华南师范大学 基于知识图谱的情感分类方法、装置、设备以及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190122111A1 (en) * 2017-10-24 2019-04-25 Nec Laboratories America, Inc. Adaptive Convolutional Neural Knowledge Graph Learning System Leveraging Entity Descriptions
CN109902171B (zh) * 2019-01-30 2020-12-25 中国地质大学(武汉) 基于分层知识图谱注意力模型的文本关系抽取方法及系统
CN111538835B (zh) * 2020-03-30 2023-05-23 东南大学 一种基于知识图谱的社交媒体情感分类方法与装置
CN111524593B (zh) * 2020-04-23 2022-08-16 厦门大学 基于上下文语言模型和知识嵌入的医疗问答方法及系统
CN113553424A (zh) * 2020-04-26 2021-10-26 阿里巴巴集团控股有限公司 数据处理方法、装置及设备及事件抽取模型的生成方法
CN113435211B (zh) * 2021-07-19 2022-07-19 北京理工大学 一种结合外部知识的文本隐式情感分析方法
CN113688212B (zh) * 2021-10-27 2022-02-08 华南师范大学 句子情感分析方法、装置以及设备

Also Published As

Publication number Publication date
CN114547312A (zh) 2022-05-27

Similar Documents

Publication Publication Date Title
CN110532571A (zh) 文本处理方法及相关装置
CN113705772A (zh) 一种模型训练方法、装置、设备及可读存储介质
Jolly Machine learning with scikit-learn quick start guide: classification, regression, and clustering techniques in Python
CN110008397B (zh) 一种推荐模型训练方法及装置
CN114676704A (zh) 句子情感分析方法、装置、设备以及存储介质
CN112182362A (zh) 训练用于在线预测点击率的模型的方法、设备及推荐系统
CN109992676B (zh) 一种跨媒体资源检索方法及检索系统
CN110874439A (zh) 一种基于评论信息的推荐方法
CN113688212B (zh) 句子情感分析方法、装置以及设备
CN116258145B (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN115587597B (zh) 基于子句级关系图的方面词的情感分析方法以及装置
US20220075955A1 (en) Neural network training method and apparatus, semantic classification method and apparatus and medium
CN114564593A (zh) 多模态知识图谱的补全方法、装置和电子设备
CN110377733A (zh) 一种基于文本的情绪识别方法、终端设备及介质
CN113722583A (zh) 推荐方法、推荐模型训练方法及相关产品
CN116151263B (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN114547312B (zh) 基于常识知识图谱的情感分析方法、装置以及设备
JP7081454B2 (ja) 処理装置、処理方法、及び処理プログラム
Qureshi et al. Performance evaluation of machine learning models on large dataset of android applications reviews
CN115905518B (zh) 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN115659987B (zh) 基于双通道的多模态命名实体识别方法、装置以及设备
CN115659951B (zh) 基于标签嵌入的语句情感分析方法、装置以及设备
CN115905524B (zh) 融合句法和语义信息的情感分析方法、装置以及设备
CN115206421B (zh) 药物重定位方法、重定位模型的训练方法及装置
CN116701935A (zh) 敏感度预测模型训练方法、敏感信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant