CN117972087A - 情感识别方法、装置、计算机设备以及存储介质 - Google Patents
情感识别方法、装置、计算机设备以及存储介质 Download PDFInfo
- Publication number
- CN117972087A CN117972087A CN202410012883.1A CN202410012883A CN117972087A CN 117972087 A CN117972087 A CN 117972087A CN 202410012883 A CN202410012883 A CN 202410012883A CN 117972087 A CN117972087 A CN 117972087A
- Authority
- CN
- China
- Prior art keywords
- emotion
- vector
- word
- feature vector
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000008909 emotion recognition Effects 0.000 title claims abstract description 117
- 238000000034 method Methods 0.000 title claims abstract description 90
- 230000008451 emotion Effects 0.000 claims abstract description 172
- 239000013598 vector Substances 0.000 claims description 405
- 230000003993 interaction Effects 0.000 claims description 95
- 238000000605 extraction Methods 0.000 claims description 82
- 238000004422 calculation algorithm Methods 0.000 claims description 71
- 238000012549 training Methods 0.000 claims description 59
- 230000006870 function Effects 0.000 claims description 41
- 239000011159 matrix material Substances 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 24
- 238000012545 processing Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 230000002776 aggregation Effects 0.000 claims description 10
- 238000004220 aggregation Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 7
- 230000002708 enhancing effect Effects 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000011176 pooling Methods 0.000 claims description 5
- 239000012633 leachable Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及设备情感识别领域,特别涉及一种情感识别方法,方法包括:基于目标域的文本数据,构建与待识别句子相关联的领域子图,用以构建待识别句子相应的外部知识增强句子以及融入外部知识的图特征信息,对待识别句子以及外部知识增强句子进行特征信息提取,获得方面特征信息以及情感特征信息,结合图特征信息、方面特征信息以及情感特征信息,实现待识别句子的方面级情感分类,提高了待识别句子的情感识别准确性。
Description
技术领域
本发明涉及设备情感识别领域,特别涉及是一种情感识别方法、装置、计算机设备以及存储介质。
背景技术
End-to-End Aspect-Based Sentiment Analysis(E2E ABSA)是情感分类任务的一个分支,它旨在联合识别出句子中特定方面术语以及它的情感极性。它涉及到两个子任务:方面术语抽取(ATE)和方面级情感分类(ASC),前者目的是提取出句子中的方面术语,后者旨在识别方面术语的情感极性。例如,给出句子“the price is reasonable althoughthe service is poor.”。ATE任务的目的是提取出句子中的方面术语,“price”和“service”。而ASC任务的目的是识别出“price”的情感极性是积极的,“service”的情感极性是消极的。现有的研究通常是依赖于大量的标注数据。然而,许多领域缺乏足够的标注数据,为领域添加标签是一个耗时耗资源的过程。为了解决这个问题,已经有研究尝试使用无监督领域自适应技术。在无监督领域自适应场景下,给定一些未标记的目标领域数据和有标记数据的源领域数据,将源领域的公共知识迁移到目标领域测试数据中。
然而,E2E ABSA是一个细粒度的任务。大多数方面术语与特定领域相关,导致不同领域的方面术语的分布差异较大。例如,在laptop领域出现的“battery”,几乎不可能出现在Restaurant领域中。因此,如何减少方面术语的领域差异成为跨领域E2E ABSA的主要挑战。近年来,因为知识图谱(KG)可以提供大量丰富的结构化知识与实体关系,有效提升领域自适应能力,所以在自然语言处理(NLP)任务中得到了广泛应用。
然而,现有的将外部知识用于领域自适应的方法往往是粗粒度的,对于E2E ABSA这种细粒度任务,往往存在大量领域特定词阻碍模型性能,如laptop领域中的“battery”,另一方面,ATE任务和ASC任务之间具有强烈的相关性。以往的大多数方法采用统一联合标注方案进行,这忽略了ATE和ASC的任务之间的相关性,缺乏了ATE任务和ASC任务之间的交互,难以理解不同领域中的方面词对整体情感评价的影响以及领域特定的情感倾向。
发明内容
基于此,本发明的目的在于,提供一种情感识别方法、装置、计算机设备以及存储介质,基于目标域的文本数据,构建与待识别句子相关联的领域子图,用以构建待识别句子相应的外部知识增强句子以及融入外部知识的图特征信息,对待识别句子以及外部知识增强句子进行特征信息提取,获得方面特征信息以及情感特征信息,结合图特征信息、方面特征信息以及情感特征信息,实现待识别句子的方面级情感分类,提高了待识别句子的情感识别准确性。
第一方面,本申请实施例提供了一种情感识别方法,包括以下步骤:
获得目标域的文本数据、待识别句子以及预设的情感识别模型,其中,所述目标域的文本数据包括若干个目标域句子,所述情感识别模型包括图卷积编码模块、单词编码模块、方面向量提取模块、情感向量提取模块、特征交互模块以及情感识别模块;
根据所述目标域的文本数据中的若干个目标域句子以及待识别句子,构建所述待识别句子对应的领域子图,将所述领域子图输入至所述图卷积编码模块,获得图特征向量,其中,所述领域子图用于指示待识别句子和目标域的领域知识关系;
根据所述领域子图,构建所述待识别句子对应的外部知识增强句子,将所述待识别句子以及外部知识增强句子输入至所述单词编码模块,获得单词嵌入特征向量;
将所述单词嵌入特征向量输入至所述方面向量提取模块中进行特征提取,获得方面特征向量,将所述方面特征向量输入至所述情感向量提取模块中进行特征提取,获得情感特征向量;
将所述方面特征向量以及情感特征向量输入至所述特征交互模块中进行特征交互,获得交互方面特征向量以及交互情感特征向量;
将所述图特征向量、交互方面特征向量以及交互情感特征向量输入至所述情感识别模块中进行分析,获得所述待识别句子的情感识别结果。
第二方面,本申请实施例提供了一种情感识别装置,包括:
数据获取模块,用于获得目标域的文本数据、待识别句子以及预设的情感识别模型,其中,所述目标域的文本数据包括若干个目标域句子,所述情感识别模型包括图卷积编码模块、单词编码模块、方面向量提取模块、情感向量提取模块、特征交互模块以及情感识别模块;
第一特征提取模块,用于根据所述目标域的文本数据中的若干个目标域句子以及待识别句子,构建所述待识别句子对应的领域子图,将所述领域子图输入至所述图卷积编码模块,获得图特征向量,其中,所述领域子图用于指示待识别句子和目标域的领域知识关系;
第二特征提取模块,用于根据所述领域子图,构建所述待识别句子对应的外部知识增强句子,将所述待识别句子以及外部知识增强句子输入至所述单词编码模块,获得单词嵌入特征向量;
第三特征提取模块,用于将所述单词嵌入特征向量输入至所述方面向量提取模块中进行特征提取,获得方面特征向量,将所述方面特征向量输入至所述情感向量提取模块中进行特征提取,获得情感特征向量;
特征交互模块,用于将所述方面特征向量以及情感特征向量输入至所述特征交互模块中进行特征交互,获得交互方面特征向量以及交互情感特征向量;
情感分析模块,用于将所述图特征向量、交互方面特征向量以及交互情感特征向量输入至所述情感识别模块中进行分析,获得所述待识别句子的情感识别结果。
第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的情感识别方法的步骤。
第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的情感识别方法的步骤。
在本申请实施例中,提供一种情感识别方法、装置、计算机设备以及存储介质,基于目标域的文本数据,构建与待识别句子相关联的领域子图,用以构建待识别句子相应的外部知识增强句子以及融入外部知识的图特征信息,对待识别句子以及外部知识增强句子进行特征信息提取,获得方面特征信息以及情感特征信息,结合图特征信息、方面特征信息以及情感特征信息,实现待识别句子的方面级情感分类,提高了待识别句子的情感识别准确性。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本申请一个实施例提供的情感识别方法的流程示意图;
图2为本申请一个实施例提供的情感识别方法中S2的流程示意图;
图3为本申请一个实施例提供的情感识别方法中S3的流程示意图;
图4为本申请一个实施例提供的情感识别方法中S4的流程示意图;
图5为本申请一个实施例提供的情感识别方法中S5的流程示意图;
图6为本申请一个实施例提供的情感识别方法中S6的流程示意图;
图7为本申请另一个实施例提供的情感识别方法中S7的流程示意图;
图8为本申请又一个实施例提供的情感识别方法中S7的流程示意图;
图9为本申请一个实施例提供的情感识别装置的结构示意图;
图10为本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”/“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。
请参阅图1,图1为本申请一个实施例提供的情感识别方法的流程示意图,所述方法包括如下步骤:
S1:获得目标域的文本数据、待识别句子以及预设的情感识别模型。
所述情感识别方法的执行主体为情感识别方法的识别设备(以下简称识别设备)。在一个可选的实施例中,所述识别设备可以是一台计算机设备可以是服务器,或是多台计算机设备联合而成的服务器机群。
在本实施例中,识别设备可以获得用户输入,也可以通过预设的数据库中,获得目标域的文本数据以及待识别句子,其中,所述目标域的文本数据包括若干个目标域句子,所述目标域句子以及待识别句子均包括若干个单词。
所述情感识别模型包括图卷积编码模块、单词编码模块、方面向量提取模块、情感向量提取模块、特征交互模块以及情感识别模块。
S2:根据所述目标域的文本数据中的若干个目标域句子以及待识别句子,构建所述待识别句子对应的领域子图,将所述领域子图输入至所述图卷积编码模块,获得图特征向量。
在本实施例中,识别设备根据所述目标域的文本数据中的若干个目标域句子以及待识别句子,构建所述待识别句子对应的领域子图,其中,所述领域子图用于指示待识别句子和目标域的领域知识关系。
具体地,识别设备从目标域的文本数据中的若干个目标域句子以及待识别句子中提取名词,动词,形容词和副词,构建若干个单词节点,将若干个单词节点组成为一个集合,通过它过滤外部知识库ConceptNet,构建所述待识别句子对应的领域子图,其中,所述领域子图包括若干个单词节点以及若干个所述单词节点之间的关系节点,所述关系节点用于指示单词节点之间的依存关系。
识别设备将所述领域子图输入至所述图卷积编码模块,获得图特征向量,其中,所述图卷积编码模块包括图卷积网络,所述图卷积网络包括若干个图卷积层。请参阅图2,图2为本申请一个实施例提供的情感识别方法中S2的流程示意图,包括步骤S21~S22,具体如下:
S21:将所述领域子图输入至所述图卷积网络,根据所述领域子图中若干个单词节点以及预设的图卷积算法,获得所述图卷积编码模块的最后一层图卷积层输出的若干个所述单词节点的图卷积向量。
所述图卷积算法为:
式中,u、j为单词索引,为所述图卷积网络的第l层图卷积层输出的第u个单词节点的图卷积向量,R为关系节点集合,包括若干个所述单词节点之间的关系节点,r为关系节点,/>为第u个单词节点在r关系节点下的相邻单词节点集,/>分别为所述图卷积网络的第l层图卷积层的第二权重参数以及第一权重参数,/>为所述图卷积网络的第l-1层图卷积层输出的第j个单词节点的图卷积向量,/>为所述图卷积网络的第l-1层图卷积层输出的第u个单词节点的图卷积向量,σ(·)为激活函数。
在本实施例中,识别设备将所述领域子图输入至所述图卷积网络,根据所述领域子图中若干个单词节点以及预设的图卷积算法,获得所述图卷积编码模块的最后一层图卷积层输出的若干个所述单词节点的图卷积向量。
S22:根据所述图卷积网络的最后一层图卷积层输出的若干个所述单词节点的图卷积向量以及预设的图特征向量计算算法,获得所述图特征向量。
所述图特征向量计算算法为:
式中,G为所述图特征向量,U为单词节点数目,g′u为所述图卷积编码模块的最后一层图卷积层输出的第u个单词节点的图卷积向量。
在本实施例中,识别设备根据所述图卷积网络的最后一层图卷积层输出的若干个所述单词节点的图卷积向量以及预设的图特征向量计算算法,采用平均处理方法,获得所述图特征向量。
S3:根据所述领域子图,构建所述待识别句子对应的外部知识增强句子,将所述待识别句子以及外部知识增强句子输入至所述单词编码模块,获得单词嵌入特征向量。
在本实施例中,识别设备根据所述领域子图,构建所述待识别句子对应的外部知识增强句子,通过所述外部知识增强句子,以提升所述待识别句子与目标域之间的联系,增加领域特定词的可迁移性,提高所述待识别句子的情感识别的准确性。
具体地,识别设备根据所述领域子图中的若干个单词节点以及若干个单词节点之间的关系节点,构建若干个三元组,其中,所述三元组包括两个单词节点以及两个单词节点之间的关系节点。
识别设备从目标域的文本数据中的若干个目标域句子中提取名词,动词,形容词和副词,构建若干个候选单词节点,将若干个候选单词节点组成为一个候选单词节点集合,识别设备将存在一个单词节点属于所述待识别句子,另一个单词节点属于所述候选单词节点集合的若干个所述三元组作为第一三元组,识别设备将若干个所述第一三元组中的属于所述候选单词节点集合的单词节点标记为vx,识别设备将存在有所述单词节点vx的若干个所述三元组作为第二三元组,遍历若干个所述第二三元组,若所述第二三元组中的另一个单词节点vy同时属于所述候选单词节点集合,将所述单词节点vx作为目标单词节点,获得所述目标单词节点对应的单词,构建所述待识别句子对应的外部知识增强句子。
识别设备将所述待识别句子以及外部知识增强句子输入至所述单词编码模块,获得单词嵌入特征向量。请参阅图3,图3为本申请一个实施例提供的情感识别方法中S3的流程示意图,包括步骤S31~S34,具体如下:
S31:根据所述待识别句子、外部知识增强句子以及预设的词嵌入编码算法,获得所述待识别句子以及外部知识增强句子的词嵌入序列。
所述词嵌入编码算法为:
E={e1,e2,...,en}=BERT({x1,x2,...,xn})
式中,E为所述待识别句子的词嵌入序列,en为所述待识别句子的词嵌入序列中第n个单词的词嵌入向量,xn为所述待识别句子中第n个单词的词向量,Ec为所述外部知识增强句子的词嵌入序列,为所述外部知识增强句子的词嵌入序列中第m个单词的词嵌入向量,cm为所述外部知识增强句子中第m个单词的词向量,BERT(·)为词嵌入编码函数。
在本实施例中,识别设备采用BERT(Bidirectional Encoder Representationfrom Transformers)词嵌入模型,根据所述待识别句子、外部知识增强句子以及预设的词嵌入编码算法,获得所述待识别句子以及外部知识增强句子的词嵌入序列,其中,所述词嵌入序列包括若干个单词的词嵌入向量。
S32:获得所述外部知识增强句子中若干个单词的出现次数,根据所述外部知识增强句子中若干个单词的出现次数以及预设的关联得分计算算法,获得所述外部知识增强句子的关联得分数据,根据所述外部知识增强句子的关联得分数据以及词嵌入序列,获得所述外部知识增强句子的聚合词嵌入序列。
为了充分利用外部知识,提高待识别句子的情感识别的准确性,在本实施例中,识别设备获得所述外部知识增强句子中若干个单词的出现次数,根据所述外部知识增强句子中若干个单词的出现次数以及预设的关联得分计算算法,获得所述外部知识增强句子的关联得分数据,其中,所述外部知识增强句子的关联得分数据包括若干个单词的关联得分向量,所述聚合词嵌入序列包括若干个单词的聚合词嵌入向量,所述关联得分计算算法为:
式中,sci为所述外部知识增强句子中第i个单词的关联得分向量,为所述外部知识增强句子中第i个单词的出现次数。
识别设备根据所述外部知识增强句子的关联得分数据以及词嵌入序列,将同一个单词的关联得分向量与词嵌入向量进行聚合,获得所述外部知识增强句子的聚合词嵌入序列,具体如下:
式中,为所述外部知识增强句子的聚合词嵌入序列中第i个单词的聚合词嵌入向量,/>为所述外部知识增强句子的词嵌入序列中第i个单词的词嵌入向量。
S33:根据所述待识别句子的词嵌入序列、外部知识增强句子的聚合词嵌入序列以及预设的上下文编码算法,获得所述待识别句子以及外部知识增强句子的上下文表示序列。
所述上下文编码算法为:
式中,为所述待识别句子的上下文表示序列,/>为所述待识别句子的上下文表示序列中第n个单词的上下文向量,/>为所述外部知识增强句子的上下文表示序列,/>为所述外部知识增强句子的上下文表示序列中第m个单词的上下文向量,/>为所述外部知识增强句子的聚合词嵌入序列中第m个单词的聚合词嵌入向量,PLM(·)为上下文编码函数。
在本实施例中,识别设备采用预训练语言模型(PLM),根据所述待识别句子的词嵌入序列、外部知识增强句子的聚合词嵌入序列以及预设的上下文编码算法,获得所述待识别句子以及外部知识增强句子的上下文表示序列,其中,所述上下文特征序列包括若干个单词的上下文向量。
S34:根据所述待识别句子、外部知识增强句子的上下文表示序列中同一个单词索引对应的上下文向量以及预设的单词嵌入特征提取算法,获得所述单词嵌入特征向量。
所述单词嵌入特征提取算法为:
式中,Z为所述单词嵌入特征向量,Wz为所述单词编码模块的权重参数,σ(·)为激活函数,为拼接符号,⊙为元素相乘符号。
在本实施例中,识别设备根据所述待识别句子、外部知识增强句子的上下文表示序列中同一个单词索引对应的上下文向量以及预设的单词嵌入特征提取算法,获得所述单词嵌入特征向量。
S4:将所述单词嵌入特征向量输入至所述方面向量提取模块中进行特征提取,获得方面特征向量,将所述方面特征向量输入至所述情感向量提取模块中进行特征提取,获得情感特征向量。
所述方面向量提取模块包括堆叠卷积网络,所述堆叠卷积网络包括若干个堆叠卷积层;所述情感向量提取模块包括多头自注意力网络。
在本实施例中,识别设备采用端到端的框架联合,将所述单词嵌入特征向量输入至所述方面向量提取模块中进行特征提取,获得方面特征向量,将所述方面特征向量输入至所述情感向量提取模块中进行特征提取,获得情感特征向量,以提取待识别句子的方面词以及情感极性。
请参阅图4,图4为本申请一个实施例提供的情感识别方法中S4的流程示意图,包括步骤S41~S43,具体如下:
S41:将所述单词嵌入特征向量作为所述堆叠卷积网络的首层输入,根据预设的堆叠卷积算法,获得所述堆叠卷积网络的最后一层堆叠卷积层输出的堆叠卷积向量,作为所述方面特征向量。
所述堆叠卷积算法为:
al=σ(al-1*kl-1+bl-1)
式中,al为所述堆叠卷积网络的第l层堆叠卷积层输出的堆叠卷积向量,al-1为所述堆叠卷积网络的第l-1层堆叠卷积层输出的堆叠卷积向量,kl-1为所述堆叠卷积网络的第l-1层堆叠卷积层的卷积核核组,bl-1为所述堆叠卷积网络的第l-1层堆叠卷积层的偏置参数,σ(·)为激活函数。
在本实施例中,识别设备将所述单词嵌入特征向量作为所述堆叠卷积网络的首层输入,根据预设的堆叠卷积算法,获得所述堆叠卷积网络的最后一层堆叠卷积层输出的堆叠卷积向量,作为所述方面特征向量,用以进行情感特征向量的提取,实现待识别句子的方面级情感分类。
S42:根据所述方面特征向量以及预设的矩阵构建算法,获得第一矩阵、第二矩阵以及第三矩阵。
所述矩阵构建算法为:
Q=a′WQ
K=a′WK
V=a′WV
式中,a′为所述方面特征向量,Q为第一矩阵,WQ为所述情感向量提取模块的第一权重参数,V为第二矩阵,WK为所述情感向量提取模块的第二权重参数,V为第三矩阵,WV为所述情感向量提取模块的第三权重参数。
在本实施例中,识别设备根据所述方面特征向量以及预设的矩阵构建算法,获得第一矩阵、第二矩阵以及第三矩阵。
S43:将所述第一矩阵、第二矩阵以及第三矩阵输入至所述多头自注意力网络,根据预设的多头自注意力提取算法,获得若干个自注意力头输出的注意力特征向量,将若干个所述自注意力头输出的注意力特征向量进行拼接处理,获得所述情感特征向量。
所述多头自注意力提取算法为:
式中,oj为第j个自注意力头输出的注意力特征向量,softmax(·)为归一化函数,T为转置符号,d为维度参数。
在本实施例中,识别设备将所述第一矩阵、第二矩阵以及第三矩阵输入至所述多头自注意力网络,根据预设的多头自注意力提取算法,获得若干个自注意力头输出的注意力特征向量,为了更好的建模方面特征向量与上下文之间的关系,识别设备通过构建方面特征向量对应的矩阵参数,采用多头自注意力机制,以提取待识别句子中准确率更高的情感特征向量,提高待识别句子的情感识别的准确性。
识别设备将若干个所述自注意力头输出的注意力特征向量进行拼接处理,获得所述情感特征向量,具体如下:
s=Concat(o1,o2,…oj)
式中,s为所述情感特征向量,Concat(·)为拼接函数。
S5:将所述方面特征向量以及情感特征向量输入至所述特征交互模块中进行特征交互,获得交互方面特征向量以及交互情感特征向量。
为了充分利用方面特征向量和情感特征向量的相关性,在本实施例中,识别设备将所述方面特征向量以及情感特征向量输入至所述特征交互模块中进行特征交互,获得交互方面特征向量以及交互情感特征向量。
请参阅图5,图5为本申请一个实施例提供的情感识别方法中S5的流程示意图,包括步骤S51~S52,具体如下:
S51:根据所述方面特征向量、情感特征向量以及预设的第一特征交互算法,获得所述交互方面特征向量。
所述第一特征交互算法为:
Ia=β·s+(1-β)·a′
式中,Ia为所述交互方面特征向量,β为,a′为所述方面特征向量。
在本实施例中,识别设备根据所述方面特征向量、情感特征向量以及预设的第一特征交互算法,获得所述交互方面特征向量。
S52:根据所述方面特征向量、情感特征向量以及预设的第二特征交互算法,获得所述交互情感特征向量。
所述第二特征交互算法为:
Is=β·a′+(1-β)·s
式中,Is为所述交互情感特征向量。
在本实施例中,识别设备根据所述方面特征向量、情感特征向量以及预设的第二特征交互算法,获得所述交互情感特征向量。
S6:将所述图特征向量、交互方面特征向量以及交互情感特征向量输入至所述情感识别模块中进行分析,获得所述待识别句子的情感识别结果。
在本实施例中,识别设备将所述图特征向量、交互方面特征向量以及交互情感特征向量输入至所述情感识别模块中进行分析,获得所述待识别句子的情感识别结果。
请参阅图6,图6为本申请一个实施例提供的情感识别方法中S6的流程示意图,包括步骤S61~S63,具体如下:
S61:对所述图特征向量进行线性处理,获得线性处理后的图特征向量,分别将所述交互方面特征向量以及交互情感特征向量与线性处理后的图特征向量进行拼接,获得拼接方面特征向量以及拼接情感特征向量。
在本实施例中,识别设备对所述图特征向量进行线性处理,获得线性处理后的图特征向量,具体如下:
G′=sigmoid(FC(G))
式中,G′为线性处理后的图特征向量,sigmoid(·)为激活函数,FC(·)为线性函数。
为了进一步使交互方面特征向量以及交互情感特征向量拥有更强的领域不变性,识别设备将所述交互方面特征向量以及交互情感特征向量与线性处理后的图特征向量进行拼接,获得拼接方面特征向量以及拼接情感特征向量,具体如下:
A=[G′,Ia]
S=[G′,Is]
式中,A为所述拼接方面特征向量,S为所述拼接情感特征向量。
S62:根据所述拼接方面特征向量以及预设的预测方面概率分布向量计算算法,获得预测方面概率分布向量,根据所述拼接情感特征向量以及预设的预测情感概率分布向量计算算法,获得预测情感概率分布向量。
在本实施例中,识别设备根据所述拼接方面特征向量以及预设的预测方面概率分布向量计算算法,获得预测方面概率分布向量,其中,所述预测方面概率分布向量计算算法为:
式中,为预测方面概率分布向量,Wa为所述方面预测模块的权重参数,softmax(·)为归一化函数;
识别设备根据所述拼接情感特征向量以及预设的预测情感概率分布向量计算算法,获得预测情感概率分布向量,其中,所述预测情感概率分布向量计算算法为:
式中,为预测情感概率分布向量,Ws为所述情感预测模块的权重参数。
S63:根据所述预测方面概率分布向量,获取概率最大的维度对应的方面预测类型,根据所述预测情感概率分布向量,获取概率最大的维度对应的情感预测类型,根据所述方面预测类型以及情感预测类型,获得所述待识别句子的情感识别结果。
在本实施例中,识别设备根据所述预测方面概率分布向量,获取概率最大的维度对应的方面预测类型,根据所述预测情感概率分布向量,获取概率最大的维度对应的情感预测类型,根据所述方面预测类型以及情感预测类型,获得所述待识别句子的情感识别结果。基于目标域的文本数据,构建与待识别句子相关联的领域子图,用以构建待识别句子相应的外部知识增强句子以及融入外部知识的图特征信息,对待识别句子以及外部知识增强句子进行特征信息提取,获得方面特征信息以及情感特征信息,结合图特征信息、方面特征信息以及情感特征信息,实现待识别句子的方面级情感分类,提高了待识别句子的情感识别准确性。
在一个可选的实施例中,还包括步骤S7:对所述情感识别模型进行训练,请参阅图7,图7为本申请另一个实施例提供的情感识别方法中S7的流程示意图,包括步骤S71~S75,具体如下:
S71:获得训练文本数据集,根据所述训练文本数据集,构建所述训练文本数据集对应的领域子图,根据所述领域子图,获得所述源领域的文本数据中若干个句子对应的外部知识增强单词句子。
在本实施例中,识别设备获得训练文本数据集,其中,所述训练文本数据集包括源领域的文本数据以及目标域的文本数据,所述文本数据包括若干个句子,所述句子包括若干个单词。
识别设备根据所述训练文本数据集,构建所述训练文本数据集对应的领域子图,用以引入外部知识,提供额外的、多样化的数据,从而有效地扩充训练数据,可以增强情感识别模型对于特定领域中专业术语、一般事实等知识的理解,从而有效缓解领域之间的差异,以增加情感识别模型的迁移性。
识别设备根据所述领域子图,获得所述源领域的文本数据中若干个句子对应的外部知识增强单词句子,作为情感识别模型的训练数据,以提升两个领域之间的联系,增加情感识别模型的领域自适应性。具体实施例可以参考步骤S2,在此不再赘述。
S72:将所述源领域的文本数据中若干个句子以及对应的外部知识增强单词句子进行组合,构建若干个训练句子组,将若干个所述训练句子组输入至所述情感识别模型,获得若干个所述训练句子组对应的拼接方面特征向量、拼接情感特征向量、预测方面概率分布向量以及预测情感概率分布向量。
在本实施例中,识别设备将所述源领域的文本数据中若干个句子以及对应的外部知识增强单词句子进行组合,构建若干个训练句子组,将若干个所述训练句子组输入至所述情感识别模型,获得若干个所述训练句子组对应的拼接方面特征向量、拼接情感特征向量、预测方面概率分布向量以及预测情感概率分布向量,具体实施例可以参考步骤S61~S62,在此不再赘述。
S73:分别对所述拼接方面特征向量以及拼接情感特征向量进行最大池化处理,获得若干个所述训练句子组对应的池化方面特征向量以及池化情感特征向量,根据若干个所述训练句子组对应的池化方面特征向量、池化情感特征向量以及预设的预测领域算法,获得若干个所述训练句子组对应的预测领域标签数据。
在本实施例中,识别设备分别对所述拼接方面特征向量以及拼接情感特征向量进行最大池化处理,获得若干个所述训练句子组对应的池化方面特征向量以及池化情感特征向量,具体如下:
Ma=Maxpool(A)
Ms=Maxpool(S)
式中,Ma为池化方面特征向量,Ms为拼接情感特征向量。
识别设备采用领域分类器,根据若干个所述训练句子组对应的池化方面特征向量、池化情感特征向量以及预设的预测领域算法,引入梯度反转层进行领域区分,获得若干个所述训练句子组对应的预测领域标签数据,其中,所述预设的预测领域算法为:
式中,为预测领域标签数据,Wd为预设的可学习参数,GRLλ(·)为梯度反转函数,λ为比例系数,MLP(·)为多层感知机函数,softmax(·)为归一化函数。
S74:获得若干个所述训练句子组对应的真实领域标签数据,根据若干个所述训练句子组对应的真实领域标签数据、预测领域标签数据以及预设的第一损失函数,获得第一损失值。
所述第一损失函数为:
式中,为第一损失值,yd为真实领域标签数据,/>为预测领域标签数据。
在本实施例中,识别设备获得若干个所述训练句子组对应的真实领域标签数据,根据若干个所述训练句子组对应的真实领域标签数据、预测领域标签数据以及预设的第一损失函数,获得第一损失值,通过领域对抗训练,结合梯度反转层在训练过程中的能够反转梯度方向的特点,鼓励特征向量保持领域不变,进一步提升领域不变性,用以提高句子的情感识别的准确性。
S75:获得若干个所述训练句子组对应的真实方面概率分布向量以及真实情感概率分布向量,根据若干个所述训练句子组对应的真实方面概率分布向量、真实情感概率分布向量、预测方面概率分布向量、预测情感概率分布向量以及预设的第二损失函数,获得第二损失值,根据所述第一损失值以及第二损失值,对所述情感识别模块进行训练。
所述第二损失函数为:
式中,为第二损失值,ya为真实方面概率分布向量,/>为预测方面概率分布向量,/>为预测情感概率分布向量,ys为真实情感概率分布向量。
在本实施例中,识别设备获得若干个所述训练句子组对应的真实方面概率分布向量以及真实情感概率分布向量,根据若干个所述训练句子组对应的真实方面概率分布向量、真实情感概率分布向量、预测方面概率分布向量、预测情感概率分布向量以及预设的第二损失函数,获得第二损失值,根据所述第一损失值以及第二损失值,对所述情感识别模块进行训练,以理解不同领域中的方面词对整体情感评价的影响以及领域特定的情感倾向,提高情感识别的准确性,具体如下:
式中,为最终损失值。
请参阅图8,图8为本申请又一个实施例提供的情感识别方法中S7的流程示意图,还包括步骤S76~S77,具体如下:
S76:根据所述训练文本数据集对应的领域子图中的若干个单词节点以及若干个单词节点之间的关系节点,构建正向三元组集。
在本实施例中,识别设备根据所述训练文本数据集对应的领域子图中的若干个单词节点以及若干个单词节点之间的关系节点,构建正向三元组集,其中,所述正向三元组集包括若干个正向三元组,所述正向三元组包括两个单词节点以及两个单词节点之间的关系节点。
S77:根据所述正向三元组集中若干个正向三元组,构建若干个所述正向三元组对应的负向三元组,构建负向三元组集,根据所述正向三元组集、负向三元组集以及预设的第三损失函数,获得第三损失值,根据所述第三损失值,对所述图卷积编码模块进行训练。
在本实施例中,识别设备根据所述正向三元组集中若干个正向三元组,构建若干个所述正向三元组对应的负向三元组,构建负向三元组集。具体地,识别设备通过对若干个所述正向三元组中的单词节点或者关系节点进行随机修改,以构建等量的若干个负向三元组。
识别设备根据所述正向三元组集、负向三元组集以及预设的第三损失函数,获得第三损失值,根据所述第三损失值,对所述图卷积编码模块进行训练,以学习图特征,其中,所述第一损失函数为:
式中,为第三损失值,s(vu,ru,j,vj)为正向三元组,vu为第u个单词节点,vj为第j个单词节点,ru,j为第u个单词节点与第j个单词节点之间的关系节点,/>为第u个单词节点的图卷积向量,T为转置符号,Rr为关系节点集合对应的对角矩阵,gj为第j个单词节点的图卷积向量,/>为由所述正向三元组集以及负向三元组集组合构建的训练三元组集,y为三元组标签表示,y∈{0,1},y=0指示该三元组为负向三元组,y=1指示该三元组为正向三元组。
请参考图9,图9为本申请一个实施例提供的情感识别装置的结构示意图,该装置可以通过软件、硬件或两者的结合实现情感识别装置的全部或一部分,该装置9包括:
数据获取模块91,用于获得目标域的文本数据、待识别句子以及预设的情感识别模型,其中,所述目标域的文本数据包括若干个目标域句子,所述情感识别模型包括图卷积编码模块、单词编码模块、方面向量提取模块、情感向量提取模块、特征交互模块以及情感识别模块;
第一特征提取模块92,用于根据所述目标域的文本数据中的若干个目标域句子以及待识别句子,构建所述待识别句子对应的领域子图,将所述领域子图输入至所述图卷积编码模块,获得图特征向量,其中,所述领域子图用于指示待识别句子和目标域的领域知识关系;
第二特征提取模块93,用于根据所述领域子图,构建所述待识别句子对应的外部知识增强句子,将所述待识别句子以及外部知识增强句子输入至所述单词编码模块,获得单词嵌入特征向量;
第三特征提取模块94,用于将所述单词嵌入特征向量输入至所述方面向量提取模块中进行特征提取,获得方面特征向量,将所述方面特征向量输入至所述情感向量提取模块中进行特征提取,获得情感特征向量;
特征交互模块95,用于将所述方面特征向量以及情感特征向量输入至所述特征交互模块中进行特征交互,获得交互方面特征向量以及交互情感特征向量;
情感分析模块96,用于将所述图特征向量、交互方面特征向量以及交互情感特征向量输入至所述情感识别模块中进行分析,获得所述待识别句子的情感识别结果。
在本申请实施例中,通过数据获取模块,获得目标域的文本数据、待识别句子以及预设的情感识别模型,其中,所述目标域的文本数据包括若干个目标域句子,所述情感识别模型包括图卷积编码模块、单词编码模块、方面向量提取模块、情感向量提取模块、特征交互模块以及情感识别模块;通过第一特征提取模块,根据所述目标域的文本数据中的若干个目标域句子以及待识别句子,构建所述待识别句子对应的领域子图,将所述领域子图输入至所述图卷积编码模块,获得图特征向量,其中,所述领域子图用于指示待识别句子和目标域的领域知识关系;通过第二特征提取模块,根据所述领域子图,构建所述待识别句子对应的外部知识增强句子,将所述待识别句子以及外部知识增强句子输入至所述单词编码模块,获得单词嵌入特征向量;通过第三特征提取模块,将所述单词嵌入特征向量输入至所述方面向量提取模块中进行特征提取,获得方面特征向量,将所述方面特征向量输入至所述情感向量提取模块中进行特征提取,获得情感特征向量;通过特征交互模块,将所述方面特征向量以及情感特征向量输入至所述特征交互模块中进行特征交互,获得交互方面特征向量以及交互情感特征向量;通过情感分析模块,将所述图特征向量、交互方面特征向量以及交互情感特征向量输入至所述情感识别模块中进行分析,获得所述待识别句子的情感识别结果。基于目标域的文本数据,构建与待识别句子相关联的领域子图,用以构建待识别句子相应的外部知识增强句子以及融入外部知识的图特征信息,对待识别句子以及外部知识增强句子进行特征信息提取,获得方面特征信息以及情感特征信息,结合图特征信息、方面特征信息以及情感特征信息,实现待识别句子的方面级情感分类,提高了待识别句子的情感识别准确性。
请参考图10,图10为本申请一个实施例提供的计算机设备的结构示意图,计算机设备10包括:处理器101、存储器102以及存储在存储器102上并可在处理器101上运行的计算机程序103;计算机设备可以存储有多条指令,指令适用于由处理器101加载并执行上述图1至图8所示的方法步骤,具体执行过程可以参见图1至图8所示的具体说明,在此不进行赘述。
其中,处理器101可以包括一个或多个处理核心。处理器101利用各种接口和线路连接服务器内的各个部分,通过运行或执行存储在存储器102内的指令、程序、代码集或指令集,以及调用存储器102内的数据,执行情感识别装置9的各种功能和处理数据,可选的,处理器101可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programble Logic Array,PLA)中的至少一个硬件形式来实现。处理器101可集成中央处理器101(CentralProcessing Unit,CPU)、图像处理器101(Graphics Processing Unit,GPU)和调制解调器等中的一个或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责触摸显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器101中,单独通过一块芯片进行实现。
其中,存储器102可以包括随机存储器102(Random Access Memory,RAM),也可以包括只读存储器102(Read-Only Memory)。可选的,该存储器102包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器102可用于存储指令、程序、代码、代码集或指令集。存储器102可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控指令等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器102可选的还可以是至少一个位于远离前述处理器101的存储装置。
本申请实施例还提供了一种存储介质,所述存储介质可以存储有多条指令,所述指令适用于由处理器加载并执行上述图1至图8所示的方法步骤,具体执行过程可以参见图1至图8所示的具体说明,在此不进行赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束算法。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。
Claims (10)
1.一种情感识别方法,其特征在于,包括以下步骤:
获得目标域的文本数据、待识别句子以及预设的情感识别模型,其中,所述目标域的文本数据包括若干个目标域句子,所述情感识别模型包括图卷积编码模块、单词编码模块、方面向量提取模块、情感向量提取模块、特征交互模块以及情感识别模块;
根据所述目标域的文本数据中的若干个目标域句子以及待识别句子,构建所述待识别句子对应的领域子图,将所述领域子图输入至所述图卷积编码模块,获得图特征向量,其中,所述领域子图用于指示待识别句子和目标域的领域知识关系;
根据所述领域子图,构建所述待识别句子对应的外部知识增强句子,将所述待识别句子以及外部知识增强句子输入至所述单词编码模块,获得单词嵌入特征向量;
将所述单词嵌入特征向量输入至所述方面向量提取模块中进行特征提取,获得方面特征向量,将所述方面特征向量输入至所述情感向量提取模块中进行特征提取,获得情感特征向量;
将所述方面特征向量以及情感特征向量输入至所述特征交互模块中进行特征交互,获得交互方面特征向量以及交互情感特征向量;
将所述图特征向量、交互方面特征向量以及交互情感特征向量输入至所述情感识别模块中进行分析,获得所述待识别句子的情感识别结果。
2.根据权利要求1所述的情感识别方法,其特征在于:所述领域子图包括若干个单词节点以及若干个所述单词节点之间的关系节点,所述图卷积编码模块包括图卷积网络,所述图卷积网络包括若干个图卷积层;
所述将所述领域子图输入至所述图卷积编码模块,获得所述待识别句子的图特征向量,包括步骤:
将所述领域子图输入至所述图卷积网络,根据所述领域子图中若干个单词节点以及预设的图卷积算法,获得所述图卷积编码模块的最后一层图卷积层输出的若干个所述单词节点的图卷积向量,其中,所述图卷积算法为:
式中,u、j为单词索引,为所述图卷积网络的第l层图卷积层输出的第u个单词节点的图卷积向量,R为关系节点集合,包括若干个所述单词节点之间的关系节点,r为关系节点,为第u个单词节点在r关系节点下的相邻单词节点集,/>分别为所述图卷积网络的第l层图卷积层的第二权重参数以及第一权重参数,/>为所述图卷积网络的第l-1层图卷积层输出的第j个单词节点的图卷积向量,/>为所述图卷积网络的第l-1层图卷积层输出的第u个单词节点的图卷积向量,σ(·)为激活函数;
根据所述图卷积网络的最后一层图卷积层输出的若干个所述单词节点的图卷积向量以及预设的图特征向量计算算法,获得所述图特征向量,其中,所述图特征向量计算算法为:
式中,G为所述图特征向量,U为单词节点数目,g′u为所述图卷积编码模块的最后一层图卷积层输出的第u个单词节点的图卷积向量。
3.根据权利要求1或2所述的情感识别方法,其特征在于:所述目标域句子以及待识别句子均包括若干个单词;
所述将所述待识别句子以及外部知识增强句子输入至所述单词编码模块,获得单词嵌入特征向量,包括步骤:
根据所述待识别句子、外部知识增强句子以及预设的词嵌入编码算法,获得所述待识别句子以及外部知识增强句子的词嵌入序列,其中,所述词嵌入序列包括若干个单词的词嵌入向量,所述词嵌入编码算法为:
E={e1,e2,...,en}=BERT({x1,x2,...,xn})
式中,E为所述待识别句子的词嵌入序列,en为所述待识别句子的词嵌入序列中第n个单词的词嵌入向量,xn为所述待识别句子中第n个单词的词向量,Ec为所述外部知识增强句子的词嵌入序列,为所述外部知识增强句子的词嵌入序列中第个单词的词嵌入向量,cm为所述外部知识增强句子中第m个单词的词向量,BERT(·)为词嵌入编码函数;
获得所述外部知识增强句子中若干个单词的出现次数,根据所述外部知识增强句子中若干个单词的出现次数以及预设的关联得分计算算法,获得所述外部知识增强句子的关联得分数据,根据所述外部知识增强句子的关联得分数据以及词嵌入序列,其中,所述外部知识增强句子的关联得分数据包括若干个单词的关联得分向量,所述聚合词嵌入序列包括若干个单词的聚合词嵌入向量,所述关联得分计算算法为:
式中,sci为所述外部知识增强句子中第i个单词的关联得分向量,为所述外部知识增强句子中第i个单词的出现次数;
根据所述待识别句子的词嵌入序列、外部知识增强句子的聚合词嵌入序列以及预设的上下文编码算法,获得所述待识别句子以及外部知识增强句子的上下文表示序列,其中,所述上下文特征序列包括若干个单词的上下文向量,所述上下文编码算法为:
式中,为所述待识别句子的上下文表示序列,/>为所述待识别句子的上下文表示序列中第n个单词的上下文向量,/>为所述外部知识增强句子的上下文表示序列,/>为所述外部知识增强句子的上下文表示序列中第个单词的上下文向量,/>为所述外部知识增强句子的聚合词嵌入序列中第个单词的聚合词嵌入向量,PLM(·)为上下文编码函数;
根据所述待识别句子、外部知识增强句子的上下文表示序列中同一个单词索引对应的上下文向量以及预设的单词嵌入特征提取算法,获得所述单词嵌入特征向量,其中,所述单词嵌入特征提取算法为:
式中,Z为所述单词嵌入特征向量,Wz为所述单词编码模块的权重参数,σ(·)为激活函数,为拼接符号,⊙为元素相乘符号。
4.根据权利要求1或3所述的情感识别方法,其特征在于:所述方面向量提取模块包括堆叠卷积网络,所述堆叠卷积网络包括若干个堆叠卷积层;所述情感向量提取模块包括多头自注意力网络;
所述将所述单词嵌入特征向量输入至所述方面向量提取模块中进行特征提取,获得方面特征向量,将所述方面特征向量输入至所述情感向量提取模块中进行特征提取,获得情感特征向量,包括步骤:
将所述单词嵌入特征向量作为所述堆叠卷积网络的首层输入,根据预设的堆叠卷积算法,获得所述堆叠卷积网络的最后一层堆叠卷积层输出的堆叠卷积向量,作为所述方面特征向量,其中,所述堆叠卷积算法为:
al=σ(al-1*kl-1+bl-1)
式中,al为所述堆叠卷积网络的第l层堆叠卷积层输出的堆叠卷积向量,al-1为所述堆叠卷积网络的第l-1层堆叠卷积层输出的堆叠卷积向量,kl-1为所述堆叠卷积网络的第l-1层堆叠卷积层的卷积核核组,bl-1为所述堆叠卷积网络的第l-1层堆叠卷积层的偏置参数,σ(·)为激活函数;
根据所述方面特征向量以及预设的矩阵构建算法,获得第一矩阵、第二矩阵以及第三矩阵,其中,所述矩阵构建算法为:
Q=a′WQ
K=a′WK
V=a′WV
式中,a′为所述方面特征向量,Q为第一矩阵,WQ为所述情感向量提取模块的第一权重参数,V为第二矩阵,WK为所述情感向量提取模块的第二权重参数,V为第三矩阵,WV为所述情感向量提取模块的第三权重参数;
将所述第一矩阵、第二矩阵以及第三矩阵输入至所述多头自注意力网络,根据预设的多头自注意力提取算法,获得若干个自注意力头输出的注意力特征向量,将若干个所述自注意力头输出的注意力特征向量进行拼接处理,获得所述情感特征向量,其中,所述多头自注意力提取算法为:
式中,oj为第j个自注意力头输出的注意力特征向量,softmax(·)为归一化函数,T为转置符号,d为维度参数。
5.根据权利要求1或4所述的情感识别方法,其特征在于,所述将所述方面特征向量以及情感特征向量输入至所述特征交互模块中进行特征交互,获得交互方面特征向量以及交互情感特征向量,包括步骤:
根据所述方面特征向量、情感特征向量以及预设的第一特征交互算法,获得所述交互方面特征向量,其中,所述第一特征交互算法为:
Ia=β·s+(1-β)·a′
式中,Ia为所述交互方面特征向量,β为,s为所述情感特征向量,a′为所述方面特征向量;
根据所述方面特征向量、情感特征向量以及预设的第二特征交互算法,获得所述交互情感特征向量,其中,所述第二特征交互算法为:
Is=β·a′+(1-β)·s
式中,Is为所述交互情感特征向量。
6.根据权利要求5所述的情感识别方法,其特征在于,所述将所述图特征向量、交互方面特征向量以及交互情感特征向量输入至所述情感识别模块中进行分析,获得所述待识别句子的情感识别结果,包括步骤:
对所述图特征向量进行线性处理,获得线性处理后的图特征向量,分别将所述交互方面特征向量以及交互情感特征向量与线性处理后的图特征向量进行拼接,获得拼接方面特征向量以及拼接情感特征向量;
根据所述拼接方面特征向量以及预设的预测方面概率分布向量计算算法,获得预测方面概率分布向量,根据所述拼接情感特征向量以及预设的预测情感概率分布向量计算算法,获得预测情感概率分布向量,其中,所述预测方面概率分布向量计算算法为:
式中,为预测方面概率分布向量,Wa为所述方面预测模块的权重参数,A为所述拼接方面特征向量,softmax(·)为归一化函数;
所述预测情感概率分布向量计算算法为:
式中,为预测情感概率分布向量,Ws为所述情感预测模块的权重参数,S为所述拼接情感特征向量;
根据所述预测方面概率分布向量,获取概率最大的维度对应的方面预测类型,根据所述预测情感概率分布向量,获取概率最大的维度对应的情感预测类型,根据所述方面预测类型以及情感预测类型,获得所述待识别句子的情感识别结果。
7.根据权利要求2所述的情感识别方法,其特征在于,还包括步骤:对所述情感识别模型进行训练;
所述对所述情感识别模型进行训练,包括步骤:
获得训练文本数据集,根据所述训练文本数据集,构建所述训练文本数据集对应的领域子图,根据所述领域子图,获得所述源领域的文本数据中若干个句子对应的外部知识增强单词句子,其中,所述训练文本数据集包括源领域的文本数据以及目标域的文本数据,所述文本数据包括若干个句子,所述句子包括若干个单词;
将所述源领域的文本数据中若干个句子以及对应的外部知识增强单词句子进行组合,构建若干个训练句子组,将若干个所述训练句子组输入至所述情感识别模型,获得若干个所述训练句子组对应的拼接方面特征向量、拼接情感特征向量、预测方面概率分布向量以及预测情感概率分布向量;
分别对所述拼接方面特征向量以及拼接情感特征向量进行最大池化处理,获得若干个所述训练句子组对应的池化方面特征向量以及池化情感特征向量,根据若干个所述训练句子组对应的池化方面特征向量、池化情感特征向量以及预设的预测领域算法,获得若干个所述训练句子组对应的预测领域标签数据,其中,所述预设的预测领域算法为:
式中,为预测领域标签数据,Wd为预设的可学习参数,Ma为池化方面特征向量,Ms为拼接情感特征向量,GRLλ(·)为梯度反转函数,λ为比例系数,MLP(·)为多层感知机函数,softmax(·)为归一化函数;
获得若干个所述训练句子组对应的真实领域标签数据,根据若干个所述训练句子组对应的真实领域标签数据、预测领域标签数据以及预设的第一损失函数,获得第一损失值,其中,所述第一损失函数为:
式中,为第一损失值,yd为真实领域标签数据,/>为预测领域标签数据;
获得若干个所述训练句子组对应的真实方面概率分布向量以及真实情感概率分布向量,根据若干个所述训练句子组对应的真实方面概率分布向量、真实情感概率分布向量、预测方面概率分布向量、预测情感概率分布向量以及预设的第二损失函数,获得第二损失值,根据所述第一损失值以及第二损失值,对所述情感识别模块进行训练,其中,所述第二损失函数为:
式中,为第二损失值,ya为真实方面概率分布向量,/>为预测方面概率分布向量,/>为预测情感概率分布向量,ys为真实情感概率分布向量。
8.根据权利要求7所述的情感识别方法,其特征在于,所述对所述情感识别模型进行训练,还包括步骤:
根据所述训练文本数据集对应的领域子图中的若干个单词节点以及若干个单词节点之间的关系节点,构建正向三元组集,其中,所述正向三元组集包括若干个正向三元组,所述正向三元组包括两个单词节点以及两个单词节点之间的关系节点;
根据所述正向三元组集中若干个正向三元组,构建若干个所述正向三元组对应的负向三元组,构建负向三元组集,根据所述正向三元组集、负向三元组集以及预设的第三损失函数,获得第三损失值,根据所述第三损失值,对所述图卷积编码模块进行训练,其中,所述第一损失函数为:
式中,为第三损失值,s(vu,ru,j,vj)为正向三元组,vi为第u个单词节点,vj为第j个单词节点,ri,j为第u个单词节点与第j个单词节点之间的关系节点,/>为第u个单词节点的图卷积向量,T为转置符号,Rr为关系节点集合对应的对角矩阵,gj为第j个单词节点的图卷积向量,/>为由所述正向三元组集以及负向三元组集组合构建的训练三元组集,y为三元组标签表示,y∈{0,1},y=0指示该三元组为负向三元组,y=1指示该三元组为正向三元组。
9.一种情感识别装置,其特征在于,包括:
数据获取模块,用于获得目标域的文本数据、待识别句子以及预设的情感识别模型,其中,所述目标域的文本数据包括若干个目标域句子,所述情感识别模型包括图卷积编码模块、单词编码模块、方面向量提取模块、情感向量提取模块、特征交互模块以及情感识别模块;
第一特征提取模块,用于根据所述目标域的文本数据中的若干个目标域句子以及待识别句子,构建所述待识别句子对应的领域子图,将所述领域子图输入至所述图卷积编码模块,获得图特征向量,其中,所述领域子图用于指示待识别句子和目标域的领域知识关系;
第二特征提取模块,用于根据所述领域子图,构建所述待识别句子对应的外部知识增强句子,将所述待识别句子以及外部知识增强句子输入至所述单词编码模块,获得单词嵌入特征向量;
第三特征提取模块,用于将所述单词嵌入特征向量输入至所述方面向量提取模块中进行特征提取,获得方面特征向量,将所述方面特征向量输入至所述情感向量提取模块中进行特征提取,获得情感特征向量;
特征交互模块,用于将所述方面特征向量以及情感特征向量输入至所述特征交互模块中进行特征交互,获得交互方面特征向量以及交互情感特征向量;
情感分析模块,用于将所述图特征向量、交互方面特征向量以及交互情感特征向量输入至所述情感识别模块中进行分析,获得所述待识别句子的情感识别结果。
10.一种计算机设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的情感识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410012883.1A CN117972087A (zh) | 2024-01-02 | 2024-01-02 | 情感识别方法、装置、计算机设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410012883.1A CN117972087A (zh) | 2024-01-02 | 2024-01-02 | 情感识别方法、装置、计算机设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117972087A true CN117972087A (zh) | 2024-05-03 |
Family
ID=90846957
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410012883.1A Pending CN117972087A (zh) | 2024-01-02 | 2024-01-02 | 情感识别方法、装置、计算机设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117972087A (zh) |
-
2024
- 2024-01-02 CN CN202410012883.1A patent/CN117972087A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109522942B (zh) | 一种图像分类方法、装置、终端设备和存储介质 | |
CN116402063B (zh) | 多模态讽刺识别方法、装置、设备以及存储介质 | |
CN114564593A (zh) | 多模态知识图谱的补全方法、装置和电子设备 | |
CN112699215B (zh) | 基于胶囊网络与交互注意力机制的评级预测方法及系统 | |
CN116151263B (zh) | 多模态命名实体识别方法、装置、设备以及存储介质 | |
CN115587597B (zh) | 基于子句级关系图的方面词的情感分析方法以及装置 | |
CN117033609B (zh) | 文本视觉问答方法、装置、计算机设备和存储介质 | |
CN114419351A (zh) | 图文预训练模型训练、图文预测模型训练方法和装置 | |
CN115131698A (zh) | 视频属性确定方法、装置、设备及存储介质 | |
CN112131261A (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
CN115588193A (zh) | 基于图注意力神经网络与视觉关系的视觉问答方法及装置 | |
Zhu et al. | Dual-decoder transformer network for answer grounding in visual question answering | |
CN116258145B (zh) | 多模态命名实体识别方法、装置、设备以及存储介质 | |
CN111445545B (zh) | 一种文本转贴图方法、装置、存储介质及电子设备 | |
CN115906863B (zh) | 基于对比学习的情感分析方法、装置、设备以及存储介质 | |
CN116561272A (zh) | 开放域视觉语言问答方法、装置、电子设备及存储介质 | |
CN114547312B (zh) | 基于常识知识图谱的情感分析方法、装置以及设备 | |
CN115827878A (zh) | 语句情感分析方法、装置以及设备 | |
CN115906861A (zh) | 基于交互方面信息融合的语句情感分析方法以及装置 | |
CN113779244B (zh) | 文档情感分类方法、装置、存储介质以及电子设备 | |
CN115659951A (zh) | 基于标签嵌入的语句情感分析方法、装置以及设备 | |
CN115033700A (zh) | 基于相互学习网络的跨领域情感分析方法、装置以及设备 | |
CN114757189A (zh) | 事件抽取方法、装置、智能终端及存储介质 | |
CN117972087A (zh) | 情感识别方法、装置、计算机设备以及存储介质 | |
CN111259176A (zh) | 融合有监督信息的基于矩阵分解的跨模态哈希检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |