CN114547312A - 基于常识知识图谱的情感分析方法、装置以及设备 - Google Patents

基于常识知识图谱的情感分析方法、装置以及设备 Download PDF

Info

Publication number
CN114547312A
CN114547312A CN202210360819.3A CN202210360819A CN114547312A CN 114547312 A CN114547312 A CN 114547312A CN 202210360819 A CN202210360819 A CN 202210360819A CN 114547312 A CN114547312 A CN 114547312A
Authority
CN
China
Prior art keywords
knowledge
matrix
graph
feature vector
embedding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210360819.3A
Other languages
English (en)
Other versions
CN114547312B (zh
Inventor
卢国钧
薛云
余海波
蔡倩华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN202210360819.3A priority Critical patent/CN114547312B/zh
Publication of CN114547312A publication Critical patent/CN114547312A/zh
Application granted granted Critical
Publication of CN114547312B publication Critical patent/CN114547312B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及情感分析领域,特别涉及一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质,通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。

Description

基于常识知识图谱的情感分析方法、装置以及设备
技术领域
本发明涉及情感分析领域,特别涉及一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质。
背景技术
如今,人们可以随时通过社交网站、博客或电商平台发表评论以表达他们对各种服务或产品的想法,这些在线评论影响着未来消费者的购买决策,同时也正成为衡量企业质量的重要的标准。为了给企业带来更高的收益,一个更为有效的情感分析方法也越来越被视为一项至关重要的任务。
目前的技术方案,通过采用计算模型分析文本语句中关于某一特定的主题、服务、或产品的观点是正面的、中性的、还是负面的,有针对性对用户的情感进行分析。其中一个重要的解决方案是细粒度情感分类(Aspect-level sentiment classification,ALSC),即利用计算模型分析文本语句中关于某一特定的主题、服务、或产品的观点是正面的、中性的、还是负面的。然而现有的技术方案仅仅关注于在线评论的文本语句的上下文信息,无法准确地对文本语句进行准确的情感分析。
发明内容
基于此,本发明提供一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质,通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。
该技术方法如下:
第一方面,本申请实施例提供了一种基于常识知识图谱的情感分析方法,包括以下步骤:
获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
第二方面,本申请实施例提供了一种基于常识知识图谱的情感分析装置,包括:
获取模块,用于获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
知识图谱嵌入矩阵构建模块,用于根据所述链接实体以及预设的知识图谱嵌入模型,获取与所述链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
摘要特征向量矩阵构建模块,用于根据所述摘要文本以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
常识特征向量获取模块,用于根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
情感分析模块,用于获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的基于常识知识图谱的情感分析方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于常识知识图谱的情感分析方法的步骤。
在本实施例中,提供一种基于常识知识图谱的情感分析方法、装置、设备以及存储介质,通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请第一实施例提供的基于常识知识图谱的情感分析方法的流程示意图;
图2为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S1的流程示意图;
图3为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S2的流程示意图;
图4为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S4的流程示意图;
图5为本申请另一个实施例提供的基于常识知识图谱的情感分析方法的流程示意图;
图6为本申请第一实施例提供的基于常识知识图谱的情感分析方法中S5的流程示意图;
图7为本申请一个实施例提供的基于常识知识图谱的情感分析装置的结构示意图;
图8为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请第一实施例提供的基于常识知识图谱的情感分析方法的流程示意图,包括如下步骤:
S1:获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图。
本申请的基于常识知识图谱的情感分析方法的执行主体为基于常识知识图谱的情感分析方法的分析设备(以下简称分析设备)。
在一个可选的实施例中,分析设备可以是一台计算机设备,可以是服务器,或多台计算机设备联合而成的服务器机群。
每一个待测文本数据集包含若干个待测句子以及标记好的待测句子中的上文、属性词以及下文的位置,所述待测句子包括上文、与所述链接实体相关联的属性词以及下文,所述属性词为待测句子中所描述的某一实体,可以是名词。
在一个可选的实施例中,所述待测文本数据集可以是SemEval2014中的Restaurant和Laptop14数据集,分析设备可以获取用户输入的待测文本数据集,并构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体、与所述链接实体对应的摘要文本以及与所述待测句子相关联的各个链接实体彼此的连接关系,所述链接实体包括头链接实体以及尾链接实体。
请参阅图2,图2为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S1的流程示意图,包括步骤S101~S102,具体如下:
S101:根据所述待测句子中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量。
所述双向编码器由一个预训练语言模型以及三个双向LSTM网络组成,所述预训练语言模型可以采用BERT(Bidirectional Encoder Representaion from Transformers)模型,也可以采用GloVe(Global Vector)模型。
在本实施例中,分析设备采用BERT模型作为所述预训练语言模型,将所述待测句子输入至所述BERT模型,获取所述BERT模型输出的待测句子的每一个词对应的特征,具体如下:
控制设备分别将上文,属性词,下文输入至所述BERT模型得到上文词特征矩阵C1,属性词词特征矩阵C2,下文词特征矩阵C3,其中,C1为
Figure 98981DEST_PATH_IMAGE001
矩阵,C2为
Figure 356525DEST_PATH_IMAGE002
矩阵,C3为
Figure DEST_PATH_IMAGE003
矩阵,
Figure 705598DEST_PATH_IMAGE004
为上文中词的总数,
Figure DEST_PATH_IMAGE005
为属性词中词的总数,
Figure 81216DEST_PATH_IMAGE006
为下文中词的总数。
Figure DEST_PATH_IMAGE007
为BERT模型的输出特征维度;
将所述上文词特征矩阵C1输入至所述第一双向LSTM网络中得到上文隐藏层特征
Figure 564150DEST_PATH_IMAGE008
,将所述属性词特征矩阵C2输入至所述第二双向LSTM网络中得到属性词隐藏层特征
Figure DEST_PATH_IMAGE009
,将所述下文词特征矩阵C3输入至所述第三双向LSTM网络中得到下文隐藏层特征
Figure 708823DEST_PATH_IMAGE010
将上文隐藏层特征
Figure 730262DEST_PATH_IMAGE008
与下文隐藏层特征
Figure 921072DEST_PATH_IMAGE010
相加后得到上下文隐藏层特
Figure DEST_PATH_IMAGE011
;将上下文隐藏层特征
Figure 83063DEST_PATH_IMAGE011
与属性词隐藏层特征
Figure 816664DEST_PATH_IMAGE009
进行哈达玛积得到属性词特征向量
Figure 632173DEST_PATH_IMAGE012
所述特征
Figure DEST_PATH_IMAGE013
均为
Figure 716804DEST_PATH_IMAGE014
维向量,
Figure DEST_PATH_IMAGE015
为双向LSTM网络的输出特征维度。所述哈达玛积运算方式为对两特征中每个数值逐个相乘获得新特征。
在本实施例中,分析设备根据所述待测句子中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量。
S102:根据所述属性特征向量以及预设的知识图谱匹配池,从所述知识图谱匹配池中获取与所述待测句子相关联的链接实体,以及与所述链接实体对应的摘要文本,构建与所述待测句子相关联的知识图谱子图。
所述知识图谱匹配池为一个
Figure 915442DEST_PATH_IMAGE016
矩阵
Figure DEST_PATH_IMAGE017
,其中,
Figure 34707DEST_PATH_IMAGE017
的第i行向量
Figure 21118DEST_PATH_IMAGE018
代表第i个实体的特征。
属性特征向量与第i个实体的匹配度计算方式为
Figure DEST_PATH_IMAGE019
,计算属性特征向量与所述知识图谱匹配池中所有实体计算匹配度,匹配度最高的实体即为属性词的链接实体。
在本实施例中,分析设备将所述属性特征向量输入至在所述知识图谱匹配池,将所述属性特征向量与所述知识图谱匹配池中的实体进行匹配,获取属性特征向量与各个实体对应的匹配度,将匹配度最高的实体作为与所述待测句子相关联的链接实体。
根据所述链接实体,从所述知识图谱匹配池中获取与所述链接实体对应的摘要文本以及与所述待测句子相关联的各个链接实体彼此的连接关系,构建与所述待测句子相关联的知识图谱子图。
S2:根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵。
所述知识图谱嵌入模型是应用于知识图谱的神经网络模型。其目标是为知识图谱中每个实体、关系计算出一种特征向量,使得知识图谱可以利用该特征向量来进行表示。
在本实施例中,分析设备将所述知识图谱子图输入至知识图谱嵌入模型中,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵
Figure 593045DEST_PATH_IMAGE020
,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量。
所述知识图谱嵌入矩阵为一个
Figure DEST_PATH_IMAGE021
的矩阵,其中
Figure 96838DEST_PATH_IMAGE022
为所述知识图谱子图中链接实体的总数,
Figure DEST_PATH_IMAGE023
为所述链接实体嵌入向量的维度,
Figure 294778DEST_PATH_IMAGE024
为所述知识图谱嵌入矩阵中第i行的链接实体嵌入向量。
请参阅图3,图3为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S2的流程示意图,包括步骤S201~S203,具体如下:
S201:根据所述知识图谱子图中的连接关系以及所述知识图谱嵌入模型,构建与所述知识图谱子图的连接关系相关联的知识图谱关系矩阵。
在本实施例中,分析设备将所述知识图谱子图中的连接关系输入至知识图谱嵌入模型中,构建与所述知识图谱子图的连接关系相关联的知识图谱关系矩阵
Figure DEST_PATH_IMAGE025
,所述知识图谱关系矩阵包括若干个连接关系特征向量。
所述知识图谱关系矩阵为一个
Figure 593035DEST_PATH_IMAGE026
的矩阵,其中
Figure DEST_PATH_IMAGE027
为所述知识图谱子图中连接关系的总数,
Figure 511312DEST_PATH_IMAGE028
为所述连接关系特征向量的维度,
Figure DEST_PATH_IMAGE029
为所述知识图谱关系矩阵中第i行的连接关系特征向量。
S202:根据所述头链接实体、连接关系、尾链接实体在所述知识图谱嵌入矩阵以及知识图谱关系矩阵中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组以及第二知识图谱集合组;
根据所述知识图谱子图中的连接关系以及链接实体,可以将所述链接实体划分为头链接实体以及尾链接实体。
在本实施例中,分析设备根据所述头链接实体在所述知识图谱嵌入矩阵
Figure 553218DEST_PATH_IMAGE030
中的索引,所述连接关系在所述知识图谱关系矩阵
Figure 115917DEST_PATH_IMAGE025
中的索引以及尾链接实体在所述知识图谱嵌入矩阵
Figure DEST_PATH_IMAGE031
中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组
Figure 709710DEST_PATH_IMAGE032
,其中,
Figure DEST_PATH_IMAGE033
为所述第一知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵
Figure 754764DEST_PATH_IMAGE031
中的索引序号,
Figure 803622DEST_PATH_IMAGE034
为所述第与知识图谱集合组中的连接关系在所述知识图谱关系矩阵
Figure 345462DEST_PATH_IMAGE025
中的索引序号,
Figure DEST_PATH_IMAGE035
为所述第一知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵
Figure 985522DEST_PATH_IMAGE031
中的索引序号。
对所述知识图谱集合组中的头链接实体、连接关系以及尾链接实体进行随机替换,构建更新后的知识图谱集合组,即第二知识图谱集合组
Figure 612812DEST_PATH_IMAGE036
,其中,
Figure DEST_PATH_IMAGE037
为所述第二知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵
Figure 996520DEST_PATH_IMAGE030
中的索引序号,
Figure 35277DEST_PATH_IMAGE038
为所述第二知识图谱集合组中的连接关系在所述知识图谱关系矩阵
Figure 439713DEST_PATH_IMAGE025
中的索引序号,
Figure DEST_PATH_IMAGE039
为所述第二知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵
Figure 695245DEST_PATH_IMAGE030
中的索引序号。
S203:采用梯度下降方法,根据所述第一知识图谱集合组、第二知识图谱集合组以及预设的损失函数,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵。
在本实施例中,分析设备将所述知识图谱集合组S以及更新后的知识图谱集合组S’输入至损失函数中,采用梯度下降方法,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵,其中,所述损失函数为:
Figure 476120DEST_PATH_IMAGE040
式中,
Figure 867918DEST_PATH_IMAGE041
为所述损失函数,
Figure 443256DEST_PATH_IMAGE042
为知识图谱嵌入目标函数,所述知识图谱嵌入目标函数
Figure 779559DEST_PATH_IMAGE043
,其中,所述知识图谱嵌入目标函数
Figure 973911DEST_PATH_IMAGE043
可以等于包括但不限于
Figure 344850DEST_PATH_IMAGE044
或者
Figure 730569DEST_PATH_IMAGE045
Figure 554169DEST_PATH_IMAGE046
为矩阵的哈达玛积。
S3:根据所述摘要文本以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量。
所述训练语言模型为可以采用BERT(Bidirectional Encoder Representaionfrom Transformers)模型,也可以采用GloVe(Global Vector)模型。
在本实施例中,分析设备将所述知识图谱子图中的摘要文本输入至训练语言模型中,构建与所述知识图谱子图的摘要文本相关联的摘要特征向量矩阵
Figure 676846DEST_PATH_IMAGE047
,所述知识图谱关系矩阵包括若干个摘要特征向量,所述摘要特征向量矩阵为一个
Figure 777657DEST_PATH_IMAGE048
的矩阵,其中
Figure 960376DEST_PATH_IMAGE022
为所述知识图谱子图中链接实体的总数,
Figure 5693DEST_PATH_IMAGE049
为所述摘要特征向量的维度。
请参阅图4,图4为本申请另一个实施例提供的基于常识知识图谱的情感分析方法的流程示意图,包括步骤S6,所述步骤S6在步骤S4之前,具体如下:
S6:根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的标准化算法,获取标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵。
所述标准化算法为:
Figure 807427DEST_PATH_IMAGE050
式中,
Figure 152957DEST_PATH_IMAGE047
为所述摘要特征向量矩阵,
Figure 116365DEST_PATH_IMAGE051
为所述标准化处理后的摘要特征向量矩阵,
Figure 914557DEST_PATH_IMAGE031
为所述知识图谱嵌入矩阵,
Figure 379036DEST_PATH_IMAGE052
为所述标准化处理后的知识图谱嵌入矩阵,
Figure 955905DEST_PATH_IMAGE053
为数学期望函数,
Figure 214848DEST_PATH_IMAGE054
为方差计算函数,
Figure 375702DEST_PATH_IMAGE055
为正数,通常为
Figure 643872DEST_PATH_IMAGE056
在本实施例中,分析设备根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的标准化算法,获取标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵,降低了矩阵后处理的复杂度,提高情感分析的精准性。
S4:根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量。
在本实施例中,分析设备根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量。
请参阅图5,图5为本申请一个实施例提供的基于常识知识图谱的情感分析方法中S4的流程示意图,包括步骤S401~S402,具体如下:
S401:将所述标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵进行拼接,作为输入特征向量输入至所述图卷积神经网络模型。
在本实施例中,分析设备将所述获取的标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵进行拼接,作为输入特征向量输入至所述图卷积神经网络模型,所述输入特征向量为:
Figure 698416DEST_PATH_IMAGE057
式中,
Figure 269205DEST_PATH_IMAGE058
为所述输入特征向量,
Figure 776410DEST_PATH_IMAGE059
为所述标准化处理后的摘要特征向量矩阵中第i行摘要特征向量,
Figure 723638DEST_PATH_IMAGE060
为所述标准化处理后的知识图谱嵌入矩阵中第i行链接实体嵌入向量。
S402:构建目标邻接矩阵,根据所述输入特征向量、目标邻接矩阵以及实体更新算法,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量。
在本实施例中,分析设备采用所述图卷积神经网络模型,构建与所述知识图谱子图的邻接矩阵
Figure 367109DEST_PATH_IMAGE061
,以表示所述知识图谱子图中各链接实体间的连接关系,其中,所述目标邻接矩阵包括若干个目标邻接向量;
所述邻接矩阵
Figure 499013DEST_PATH_IMAGE062
为一个
Figure 867415DEST_PATH_IMAGE063
Figure 477388DEST_PATH_IMAGE063
列的矩阵,
Figure 116311DEST_PATH_IMAGE064
为所述目标邻接矩阵的目标邻接向量,当
Figure 419116DEST_PATH_IMAGE065
,代表链接实体i和链接实体j相连,反之,当
Figure 635334DEST_PATH_IMAGE066
,代表链接实体i和链接实体j不具有连接关系相连。
分析设备将所述邻接矩阵
Figure 924364DEST_PATH_IMAGE067
进行标准化,获得标准化后的目标邻接矩阵
Figure 542427DEST_PATH_IMAGE068
,其中,
Figure 891500DEST_PATH_IMAGE069
为所述邻接矩阵
Figure 860593DEST_PATH_IMAGE062
的度矩阵,
Figure 812368DEST_PATH_IMAGE070
Figure 927348DEST_PATH_IMAGE071
Figure 306377DEST_PATH_IMAGE072
以及
Figure 638132DEST_PATH_IMAGE073
为所述邻接矩阵
Figure 393599DEST_PATH_IMAGE062
的度矩阵的特征向量。
将所述输入特征向量、目标邻接矩阵输入至所述图卷积神经网络模型中的实体更新算法,获取与所述知识图谱子图相关联的常识特征向量。
所述实体更新算法为:
Figure 986254DEST_PATH_IMAGE074
式中,
Figure 411550DEST_PATH_IMAGE075
为所述常识特征向量,
Figure 89656DEST_PATH_IMAGE076
为所述目标邻接矩阵的行数,
Figure 524180DEST_PATH_IMAGE077
为所述目标邻接矩阵的目标邻接向量,
Figure 236921DEST_PATH_IMAGE078
为所述图卷积神经网络模型中第k层网络的权重更新参数,
Figure 957752DEST_PATH_IMAGE079
为所述第j个链接实体在图卷积神经网络模型中第k层的节点的输入特征向量,
Figure 497056DEST_PATH_IMAGE080
为所述第j个链接实体在图卷积神经网络模型中第k层的节点的权重更新偏置项。
S5:获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
在本实施例中,分析设备获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
请参阅图6,图6为本申请第一实施例提供的基于常识知识图谱的情感分析方法中S5的流程示意图,包括步骤S501~S502,具体如下:
S501:将所述情感特征向量以及常识特征向量进行拼接,获取情感分析特征,将所述情感分析特征输入至所述情感分析算法中,获取情感分类极性概率分布向量。
所述情感分析算法为:
Figure 328745DEST_PATH_IMAGE081
式中,
Figure 36938DEST_PATH_IMAGE082
为所述情感分类极性概率分布向量,
Figure 194250DEST_PATH_IMAGE083
为单层感知机的权重更新参数,
Figure 722315DEST_PATH_IMAGE084
为单层感知机的权重更新偏置项,
Figure 357695DEST_PATH_IMAGE085
为所述情感分析特征;
Figure 45029DEST_PATH_IMAGE086
为归一化指数函数,其中,
Figure 248608DEST_PATH_IMAGE087
式中,
Figure 123023DEST_PATH_IMAGE089
Figure 950644DEST_PATH_IMAGE090
维向量,
Figure 492484DEST_PATH_IMAGE089
Figure 726020DEST_PATH_IMAGE091
函数的输入,
Figure 228676DEST_PATH_IMAGE089
Figure 205859DEST_PATH_IMAGE092
Figure 477572DEST_PATH_IMAGE093
个标量组成,
Figure 147588DEST_PATH_IMAGE094
代表
Figure 996595DEST_PATH_IMAGE089
i维的数值。经过softmax函数的计算后得到的最终向量同为
Figure 918415DEST_PATH_IMAGE095
维向量,具体如下:
Figure 903688DEST_PATH_IMAGE096
在本实施例中,分析设备将所述情感特征向量以及常识特征向量进行拼接,获取情感分析特征
Figure 118507DEST_PATH_IMAGE085
,利用softmax函数和单层感知机构建所述情感分析算法,将所述情感分析特征输入至所述情感分析算法中,获取情感分类极性概率分布向量。
S502:根据所述情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,作为所述待测文本数据集的情感分析结果。
在本实施例中,分析设备根据所述情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,作为所述待测文本数据集的情感分析结果,具体地,当计算得到
Figure 720389DEST_PATH_IMAGE082
=[
Figure 39375DEST_PATH_IMAGE082
积极,
Figure 285680DEST_PATH_IMAGE082
消极,
Figure 31919DEST_PATH_IMAGE082
中性]=[0.1,0.7,0.2],概率最大为
Figure 996464DEST_PATH_IMAGE082
消极,其概率最大的维度对应的情感极性为消极,作为所述待测文本数据集的情感分析结果。
在一个可选的实施例中,本申请还提供一种网络信息推荐方法,所述网络信息推荐方法应用了上述基于常识知识图谱的情感分析方法,首先获取社交网络平台上用户发表的评论信息,作为所述待测文本数据集,并构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图。根据本申请提供的所述基于常识知识图谱的情感分析方法,获得所述待测文本数据集的情感分析结果。并根据所述待测文本数据集的情感分析结果,获取情感极性为积极的待测句子及其对应的评论信息,获取发表所述评论信息的用户的用户标识,根据所述用户标识,向所述用户推送与情感极性为积极的所述待测句子相关联的网络信息。
在本实施例中,所述待测文本数据集是基于社交网络平台获取的数据集,例如Twitter、Youtube等社交网络平台,分析设备通过与所述社交网络平台进行连接,获取用户对某一服务或者产品发表的评论信息,作为所述待测文本数据集,并构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图。
当分析后获取所述待测文本数据集的情感分析结果后,分析设备根据所述情感分析结果获取其中情感极性为积极的待测句子,获取对应的用户发表的评论信息,以及对应的用户标识,向相应的用户推送相关联的网络信息,所述网络信息可以是相关的服务信息或者产品信息。
请参阅图7,图7为本申请一个实施例提供的基于常识知识图谱的情感分析装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现基于常识知识图谱的情感分析方法的全部或一部分,该装置7包括:
获取模块71,用于获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
知识图谱嵌入矩阵构建模块72,用于根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
摘要特征向量矩阵构建模块73,用于根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
常识特征向量获取模块74,用于根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
情感分析模块75,用于获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
在本申请的实施例中,通过获取模块,获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
通过知识图谱嵌入矩阵构建模块,根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;通过摘要特征向量矩阵构建模块,根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;通过常识特征向量获取模块,根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;通过情感分析模块,获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。本申请通过构建待测文本数据集的知识图谱子图,获取与所述知识图谱子图相关联的常识特征向量,结合获取到的情感特征向量,更加全面地对待测文本数据集进行情感分析,提升了情感分析的准确性以及效率。
请参考图8,图8为本申请一个实施例提供的计算机设备的结构示意图,计算机设备8包括:处理器81、存储器82以及存储在存储器82上并可在处理器81上运行的计算机程序83;计算机设备可以存储有多条指令,指令适用于由处理器81加载并执行上述图1至图6所述实施例的方法步骤,具体执行过程可以参见图1至图6所述实施例的具体说明,在此不进行赘述。
其中,处理器81可以包括一个或多个处理核心。处理器81利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器82内的指令、程序、代码集或指令集,以及调用存储器82内的数据,执行基于常识知识图谱的情感分析装置6的各种功能和处理数据,可选的,处理器81可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrambleLogic Array,PLA)中的至少一个硬件形式来实现。处理器81可集成中央处理器81(CentralProcessing Unit,CPU)、图像处理器81(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器81中,单独通过一块芯片进行实现。
其中,存储器82可以包括随机存储器82(Random Access Memory,RAM),也可以包括只读存储器82(Read-Only Memory)。可选的,该存储器82包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器82可用于存储指令、程序、代码、代码集或指令集。存储器82可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器82可选的还可以是至少一个位于远离前述处理器81的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行所示实施例一至实施例三的方法步骤,具体执行过程可以参见所示图1至图6所述实施例的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。

Claims (10)

1.一种基于常识知识图谱的情感分析方法,其特征在于,包括以下步骤:
获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
根据所述知识图谱子图以及预设的训练语言模型,获取与所述知识图谱子图中的摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
2.根据权利要求1所述的基于常识知识图谱的情感分析方法,其特征在于:所述待测句子包括上文、与所述链接实体相关联的属性词以及下文,所述知识图谱子图还包括与所述待测句子相关联的各个链接实体彼此的连接关系,所述链接实体包括头链接实体以及尾链接实体。
3.根据权利要求2所述的基于常识知识图谱的情感分析方法,其特征在于,所述构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,包括步骤:
根据所述待测句子中的上文、属性词、下文以及预设的双向编码器,获取与所述属性词相关联的属性特征向量;
根据所述属性特征向量以及预设的知识图谱匹配池,从所述知识图谱匹配池中获取与所述待测句子相关联的链接实体,以及与所述链接实体对应的摘要文本,构建与所述待测句子相关联的知识图谱子图。
4.根据权利要求3所述的基于常识知识图谱的情感分析方法,其特征在于,所述根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,包括步骤:
根据所述连接关系以及所述知识图谱嵌入模型,构建与所述知识图谱子图相关联的知识图谱关系矩阵;
根据所述头链接实体、连接关系、尾链接实体在所述知识图谱嵌入矩阵以及知识图谱关系矩阵中的索引,构建与所述知识图谱子图相关联的第一知识图谱集合组以及第二知识图谱集合组,所述第一知识图谱集合组为:
Figure 340224DEST_PATH_IMAGE001
式中,
Figure 279099DEST_PATH_IMAGE002
为所述第一知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵
Figure 193965DEST_PATH_IMAGE003
中的索引序号,
Figure 59153DEST_PATH_IMAGE004
为所述第与知识图谱集合组中的连接关系在所述知识图谱关系矩阵
Figure 791486DEST_PATH_IMAGE005
中的索引序号,
Figure 109335DEST_PATH_IMAGE006
为所述第一知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵
Figure 703258DEST_PATH_IMAGE007
中的索引序号;
所述第二知识图谱集合组为:
Figure 157373DEST_PATH_IMAGE008
式中,
Figure 201553DEST_PATH_IMAGE009
为所述第二知识图谱集合组中的头链接实体在所述知识图谱嵌入矩阵
Figure 865752DEST_PATH_IMAGE007
中的索引序号,
Figure 653579DEST_PATH_IMAGE010
为所述第二知识图谱集合组中的连接关系在所述知识图谱关系矩阵
Figure 327313DEST_PATH_IMAGE005
中的索引序号,
Figure 276815DEST_PATH_IMAGE011
为所述第二知识图谱集合组中的尾链接实体在所述知识图谱嵌入矩阵
Figure 303677DEST_PATH_IMAGE007
中的索引序号;
采用梯度下降方法,根据第一知识图谱集合组、第二知识图谱集合组以及预设的损失函数,对所述知识图谱嵌入矩阵、知识图谱关系矩阵进行更新,获取更新后的知识图谱嵌入矩阵,其中,所述损失函数为:
Figure 754250DEST_PATH_IMAGE012
式中,
Figure 917378DEST_PATH_IMAGE013
为所述损失函数,
Figure 178726DEST_PATH_IMAGE014
为知识图谱嵌入目标函数。
5.根据权利要求4所述的基于常识知识图谱的情感分析方法,其特征在于,所述根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量之前,包括步骤:
根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的标准化算法,获取标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵,其中,所述标准化算法为:
Figure 692884DEST_PATH_IMAGE015
式中,
Figure 681568DEST_PATH_IMAGE016
为所述摘要特征向量矩阵,
Figure 964782DEST_PATH_IMAGE017
为所述标准化处理后的摘要特征向量矩阵,
Figure 521665DEST_PATH_IMAGE007
为所述知识图谱嵌入矩阵,
Figure 631442DEST_PATH_IMAGE018
为所述标准化处理后的知识图谱嵌入矩阵,
Figure 33604DEST_PATH_IMAGE019
为数学期望函数,
Figure 561537DEST_PATH_IMAGE020
为方差计算函数,
Figure 289322DEST_PATH_IMAGE021
为正数。
6.根据权利要求5所述的基于常识知识图谱的情感分析方法,其特征在于,所述根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量,包括步骤:
将所述标准化处理后的知识图谱嵌入矩阵以及摘要特征向量矩阵进行拼接,作为输入特征向量输入至所述图卷积神经网络模型;
构建目标邻接矩阵,所述目标邻接矩阵包括若干个目标邻接向量;根据所述输入特征向量、目标邻接矩阵以及实体更新算法,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量,其中,所述实体更新算法为:
Figure 512493DEST_PATH_IMAGE022
式中,
Figure 859292DEST_PATH_IMAGE023
为所述常识特征向量,
Figure 851519DEST_PATH_IMAGE024
为所述目标邻接矩阵的行数,
Figure 874838DEST_PATH_IMAGE025
为所述目标邻接矩阵的目标邻接向量,
Figure 585305DEST_PATH_IMAGE026
为所述图卷积神经网络模型中第k层网络的权重更新参数,
Figure 860429DEST_PATH_IMAGE027
为第j个链接实体在图卷积神经网络模型中第k层的节点的输入特征向量,
Figure 83993DEST_PATH_IMAGE028
为所述第j个链接实体在图卷积神经网络模型中第k层的节点的权重更新偏置项。
7.根据权利要求1所述的基于常识知识图谱的情感分析方法,其特征在于,所述根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果,包括步骤:
将所述情感分析特征输入至所述情感分析算法中,获取情感分类极性概率分布向量,其中,所述情感分析算法为:
Figure 153580DEST_PATH_IMAGE029
式中,
Figure 475977DEST_PATH_IMAGE030
为所述情感分类极性概率分布向量,
Figure 289212DEST_PATH_IMAGE031
为归一化指数函数,
Figure 131398DEST_PATH_IMAGE032
为单层感知机的权重更新参数,
Figure 371886DEST_PATH_IMAGE033
为单层感知机的权重更新偏置项,
Figure 56945DEST_PATH_IMAGE034
为所述情感分析特征;
根据所述情感分类极性概率分布向量,获取概率最大的维度对应的情感极性,将所述情感极性作为所述待测文本数据集的情感分析结果,其中,所述情感极性包括积极、中性以及消极。
8.一种基于常识知识图谱的情感分析装置,其特征在于,包括:
获取模块,用于获取待测文本数据集,构建与所述待测文本数据集中若干个待测句子相关联的知识图谱子图,其中,所述知识图谱子图包括链接实体,以及与所述链接实体对应的摘要文本;
知识图谱嵌入矩阵构建模块,用于根据所述知识图谱子图以及预设的知识图谱嵌入模型,获取与所述知识图谱子图的链接实体相关联的知识图谱嵌入矩阵,其中,所述知识图谱嵌入矩阵包括若干个链接实体嵌入向量;
摘要特征向量矩阵构建模块,用于根据所述知识图谱子图以及预设的训练语言模型,获取与所述摘要文本相关联的摘要特征向量矩阵,其中,所述摘要特征向量矩阵包括若干个摘要特征向量;
常识特征向量获取模块,用于根据所述知识图谱嵌入矩阵、摘要特征向量矩阵以及预设的图卷积神经网络模型,对所述知识图谱子图中的链接实体进行更新,获取更新后的所述链接实体的表达特征向量,作为常识特征向量;
情感分析模块,用于获取与所述待测文本数据集相关联的情感特征向量,将所述情感特征向量与常识特征向量进行拼接,作为情感分析特征向量,根据所述情感分析特征向量以及预设的情感分析算法,获取所述待测文本数据集的情感分析结果。
9.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的基于常识知识图谱的情感分析方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的基于常识知识图谱的情感分析方法的步骤。
CN202210360819.3A 2022-04-07 2022-04-07 基于常识知识图谱的情感分析方法、装置以及设备 Active CN114547312B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210360819.3A CN114547312B (zh) 2022-04-07 2022-04-07 基于常识知识图谱的情感分析方法、装置以及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210360819.3A CN114547312B (zh) 2022-04-07 2022-04-07 基于常识知识图谱的情感分析方法、装置以及设备

Publications (2)

Publication Number Publication Date
CN114547312A true CN114547312A (zh) 2022-05-27
CN114547312B CN114547312B (zh) 2022-08-16

Family

ID=81664714

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210360819.3A Active CN114547312B (zh) 2022-04-07 2022-04-07 基于常识知识图谱的情感分析方法、装置以及设备

Country Status (1)

Country Link
CN (1) CN114547312B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905518A (zh) * 2022-10-17 2023-04-04 华南师范大学 基于知识图谱的情感分类方法、装置、设备以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190122111A1 (en) * 2017-10-24 2019-04-25 Nec Laboratories America, Inc. Adaptive Convolutional Neural Knowledge Graph Learning System Leveraging Entity Descriptions
CN109902171A (zh) * 2019-01-30 2019-06-18 中国地质大学(武汉) 基于分层知识图谱注意力模型的文本关系抽取方法及系统
CN111524593A (zh) * 2020-04-23 2020-08-11 厦门大学 基于上下文语言模型和知识嵌入的医疗问答方法及系统
CN111538835A (zh) * 2020-03-30 2020-08-14 东南大学 一种基于知识图谱的社交媒体情感分类方法与装置
CN113435211A (zh) * 2021-07-19 2021-09-24 北京理工大学 一种结合外部知识的文本隐式情感分析方法
CN113553424A (zh) * 2020-04-26 2021-10-26 阿里巴巴集团控股有限公司 数据处理方法、装置及设备及事件抽取模型的生成方法
CN113688212A (zh) * 2021-10-27 2021-11-23 华南师范大学 句子情感分析方法、装置以及设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190122111A1 (en) * 2017-10-24 2019-04-25 Nec Laboratories America, Inc. Adaptive Convolutional Neural Knowledge Graph Learning System Leveraging Entity Descriptions
CN109902171A (zh) * 2019-01-30 2019-06-18 中国地质大学(武汉) 基于分层知识图谱注意力模型的文本关系抽取方法及系统
CN111538835A (zh) * 2020-03-30 2020-08-14 东南大学 一种基于知识图谱的社交媒体情感分类方法与装置
CN111524593A (zh) * 2020-04-23 2020-08-11 厦门大学 基于上下文语言模型和知识嵌入的医疗问答方法及系统
CN113553424A (zh) * 2020-04-26 2021-10-26 阿里巴巴集团控股有限公司 数据处理方法、装置及设备及事件抽取模型的生成方法
CN113435211A (zh) * 2021-07-19 2021-09-24 北京理工大学 一种结合外部知识的文本隐式情感分析方法
CN113688212A (zh) * 2021-10-27 2021-11-23 华南师范大学 句子情感分析方法、装置以及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈曦等: "规则增强的知识图谱表示学习方法", 《情报工程》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115905518A (zh) * 2022-10-17 2023-04-04 华南师范大学 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN115905518B (zh) * 2022-10-17 2023-10-20 华南师范大学 基于知识图谱的情感分类方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN114547312B (zh) 2022-08-16

Similar Documents

Publication Publication Date Title
CN110532571A (zh) 文本处理方法及相关装置
Jolly Machine learning with scikit-learn quick start guide: classification, regression, and clustering techniques in Python
CN114676704A (zh) 句子情感分析方法、装置、设备以及存储介质
CN116402063B (zh) 多模态讽刺识别方法、装置、设备以及存储介质
CN113688212B (zh) 句子情感分析方法、装置以及设备
CN109992676B (zh) 一种跨媒体资源检索方法及检索系统
CN112182362A (zh) 训练用于在线预测点击率的模型的方法、设备及推荐系统
CN116258145B (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN113722583A (zh) 推荐方法、推荐模型训练方法及相关产品
CN115587597B (zh) 基于子句级关系图的方面词的情感分析方法以及装置
CN113628059A (zh) 一种基于多层图注意力网络的关联用户识别方法及装置
CN116151263B (zh) 多模态命名实体识别方法、装置、设备以及存储介质
CN115048938A (zh) 基于语义和句法双通道的语句情感分析方法以及装置
CN115168592A (zh) 基于方面类别的语句情感分析方法、装置以及设备
CN111538841B (zh) 基于知识互蒸馏的评论情感分析方法、装置及系统
CN114547312B (zh) 基于常识知识图谱的情感分析方法、装置以及设备
CN113505583A (zh) 基于语义决策图神经网络的情感原因子句对提取方法
Qureshi et al. Performance evaluation of machine learning models on large dataset of android applications reviews
CN115905518B (zh) 基于知识图谱的情感分类方法、装置、设备以及存储介质
CN115659987B (zh) 基于双通道的多模态命名实体识别方法、装置以及设备
CN110262906B (zh) 接口标签推荐方法、装置、存储介质和电子设备
CN115905524B (zh) 融合句法和语义信息的情感分析方法、装置以及设备
Cífka et al. Black-box language model explanation by context length probing
CN115827878A (zh) 语句情感分析方法、装置以及设备
CN116701935A (zh) 敏感度预测模型训练方法、敏感信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant