CN113779245A - 一种评论情感原因三元组抽取方法 - Google Patents

一种评论情感原因三元组抽取方法 Download PDF

Info

Publication number
CN113779245A
CN113779245A CN202110973766.8A CN202110973766A CN113779245A CN 113779245 A CN113779245 A CN 113779245A CN 202110973766 A CN202110973766 A CN 202110973766A CN 113779245 A CN113779245 A CN 113779245A
Authority
CN
China
Prior art keywords
emotion
reason
triple
sentence
sentences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110973766.8A
Other languages
English (en)
Other versions
CN113779245B (zh
Inventor
宋大为
宋昊霖
华玲誉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN202110973766.8A priority Critical patent/CN113779245B/zh
Publication of CN113779245A publication Critical patent/CN113779245A/zh
Application granted granted Critical
Publication of CN113779245B publication Critical patent/CN113779245B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Tourism & Hospitality (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种评论情感原因三元组抽取方法,属于自然语言处理中的情感分析及信息抽取技术领域。本方法综合了情感原因抽取技术、情感分析技术和信息抽取技术,同时抽取出情感句、原因句以及情感类型三元组,即情感原因三元组,并将其应用于评论场景。本方法克服了情感原因抽取结果实用性较低、应用场景受限的缺点,解决了现有情感原因抽取方法存在的错误传播、使用复杂、耗时等缺点,实现了情感原因三元组端到端的抽取。本方法改进了现有评论方式分类粒度较粗、信息过多等问题,可以很好的提高用户的使用体验。

Description

一种评论情感原因三元组抽取方法
技术领域
本发明涉及一种评论情感原因三元组抽取方法,属于自然语言处理中的情感分析及信息抽取技术领域。
背景技术
情感分析的发展和快速起步,得益于网络上的社交媒体,例如产品评论、论坛讨论、微博、微信的快速发展,是人类历史上第一次有如此巨大数字量的形式记录。目前,情感分析已经成长为自然语言处理(NLP)中最活跃的研究领域之一,在数据挖掘、Web挖掘、文本挖掘和信息检索方面有广泛的研究。
传统的情感分析技术,仅能得到文本的情感极性(正向、中性、负向)。但是,更多深层次信息(例如引起情感的原因、表达情感的对象等)仍值得进一步挖掘。
情感原因对的抽取,旨在同时抽取出文本中的情感和引起情感的原因,从而获得更加丰富的和更深层次的信息。例如,“这台笔记本电脑真不好用,风扇特别吵,千万不要购买”,其中,“这台笔记本电脑真不好用”是情感句,而“风扇特别吵”则是与前述情感句所对应的原因句。这两个句子能够组成一个情感原因对。情感原因对的抽取结果,在舆情分析、文本分类、推荐系统等任务中,都有着很好的辅助作用。
目前,情感原因对的抽取,更多专注于情感句和原因句的抽取,且大多采用分开两步的抽取方法。第一步:从文档中抽取出情感句集合和原因句,并对这两个集合做笛卡尔积,转换为一个情感原因对集合。第二步:对情感原因对集合进行分类,判断情感句是否由对应原因句引起。
但是,现有的情感原因对抽取任务忽略了“情感类型”这一特征,导致抽取出的情感原因对不能被很好的利用,这大大限制了情感原因对在实际中的应用。例如,对于大量文本来说,单纯的抽取出情感句和原因句,如想要基于情感原因对进行决策制定(改进商品某点、保持某点,或者以某点为宣传点)或者文本分类则无法做到。但是,同时抽取出情感类型,如“这台笔记本电脑真不好用,风扇特别吵,千万不要购买”中,情感原因对的情感类型为:愤怒,则可以帮助商家了解产品需要改进的方面:风扇。
同时,采用两步的方法还存在着步与步之间的错误传播、使用复杂(需要保存中间结果)、耗时等多种缺点。
此外,目前的评论分类方式大多基于评分、好评差评、关键词抽取等粗粒度的方式,且只能简单的展示用户的完整评价全文。基于评分、好评差评的分类方式更多依靠用户所打分数,但在评论中有可能同时存在好的描述和坏的描述,而分数只是一个总体的指标。基于关键词抽取的分类方式,往往需要多个评论文本中有相同的短语,但每个人用词不同,同一个语义可以有不同的表达方式,这导致关键词抽取的质量不高、数量不多。而更加细粒度的分类以及更加浓缩的高质量的信息往往需要展示给用户。
发明内容
本发明的目的是为了克服现有技术在解决情感原因对抽取时存在的缺陷,为提高情感原因的利用率和应用效果,提出了一种端到端的评论情感原因三元组抽取方法。
本方法的创新点在于:综合了情感原因抽取技术、情感分析技术和信息抽取技术,同时抽取出情感句、原因句以及情感类型三元组,即情感原因三元组,并展示了其在评论场景下的具体应用。
首先,提出<情感-原因-情感类型>的情感原因三元组:从文档中同时抽取出情感句、与情感句对应的原因句和情感类型;之后,利用深度学习模型和双仿射注意力机制建模情感句、原因句以及情感类型之间的联系,得到情感原因三元组的三维概率矩阵;根据三维概率矩阵训练模型,以任意文档作为输入,抽取出情感原因三元组;最后,将用户要表达情感的对象与所有情感原因三元组中的句子进行关键词匹配,若句子中存在对应关键词,则表示此情感原因三元组与关键词相关。
如图1所示,本发明具体包括以下步骤:
步骤1:设计抽取情感原因三元组的模型。
具体地,步骤1包括以下步骤:
步骤1.1:输入数据集中的每个文档,输出标注情感原因三元组后的数据集。其中,数据集包括训练集和测试集。
具体地,步骤1.1包括以下步骤:
步骤1.1.1:对数据集中每个文档中的句子进行分词,词与词之间用空格隔开。
步骤1.1.2:对数据集中的每个文档,标注出所包含的情感原因对。例如,(0,1)表示第0句为情感句,第1句为其对应的原因句。
步骤1.1.3:对数据集中每个文档中的情感句,标注出其情感类型。可以按照以下方式:
高兴:0,惊喜:1,厌恶:2,愤怒:3。
步骤1.2:从步骤1.1输出的数据集中,选择训练文档W。
每个W中包含n个句子S,每个句子S中包含m个词C。其中,文档W个数的范围为1到K,共K个训练文档。
步骤1.3:对步骤1.2得到的训练文档的句子进行编码,得到句向量sn
具体地,步骤1.3包括以下步骤:
步骤1.3.1:利用式1的词嵌入函数,将句子的每个词Cm转换为词嵌入向量cm
cm=embed(Cm) (1)
其中,embed(·)是嵌入函数。对于输入的每一个词Cm,在训练好的词嵌入向量表中查找得到对应的词嵌入向量cm(向量统一采用加粗的小写字母表示)。
步骤1.3.2:利用式2、3、4,将步骤1.3.1中得到的词嵌入向量cm作为深度学习模型(双向LSTM与attention)的输入,建模词与词之间的上下文关系,得到每个句子的句向量sn
Figure BDA0003226897410000031
scorej=vTtanh(W′hm) (3)
Figure BDA0003226897410000032
其中,
Figure BDA0003226897410000033
分别表示前向和后向的LSTM(长短期记忆神经网络);hm
Figure BDA0003226897410000034
拼接了前向和后向LSTM输出后的向量;scorej为attention机制输出的分数,vT、W′均为可训练参数,T表示转置操作;softmax(·)为归一化函数,限制输出结果总和为1;M表示单词个数;
步骤2:利用双仿射注意力机制建模情感句、原因句和情感类型之间的联系,得到情感原因三元组的三维概率矩阵。
具体地,步骤2包括以下子步骤:
步骤2.1:为了加速训练以及防止过拟合,利用两个全连接网络,对步骤1中得到的句向量sn进行维度压缩,除去冗余信息,分别得到情感句向量
Figure BDA0003226897410000041
和原因句向量
Figure BDA0003226897410000042
步骤2.2:利用双仿射注意力机制建模情感句向量
Figure BDA0003226897410000043
原因句向量
Figure BDA0003226897410000044
和情感类型之间的联系。
采用式5得到一个三维的矩阵Up,q,r,三个维度分别表示情感句、原因句和情感类型。
Figure BDA0003226897410000045
其中,
Figure BDA0003226897410000046
Figure BDA0003226897410000047
为可训练参数,
Figure BDA0003226897410000048
分别为第p个情感句向量、第q个原因句向量;T表示转置操作。
矩阵Up,q,r中,每一位经过sigmoid函数后,输出0到1的值,表示此位是情感原因三元组的概率。例如,(0,1,0)表示第0句是情感句,第1句是原因句并且情感类型为“高兴”的概率。sigmoid函数如式6所示:
Figure BDA0003226897410000049
其中,sigmoid(·)表示归一化,将矩阵U中每一位归一化为0到1的值,以此来表示概率;
Figure BDA00032268974100000410
为最终得到的情感三维矩阵中第p个情感句、第q个原因句、第r个情感类型需要抽取的三元组的概率值。
此处,设置一个阈值0.5,凡是大于该阈值的概率值,认为是需要抽取出的情感原因三元组,反之不需要抽取。
步骤3:根据步骤2得到的三维概率矩阵训练模型,以任意文档作为输入,抽取出情感原因三元组;
具体地,步骤3包括以下步骤:
步骤3.1:采用二元交叉熵衡量真实概率Yp,q,r与模型预测概率
Figure BDA00032268974100000411
之间分布的差异性,并以此为模型的目标函数L进行训练,如式7所示:
Figure BDA00032268974100000412
其中,真实概率Yp,q,r是指情感原因三元组标签的概率,是情感原因三元组则概率为1,否则为0;∑p,q,r表示对不同p、q、r二元交叉熵结果的加和。
步骤3.2:使用批量随机梯度下降方法,对步骤3.1的目标函数进行优化,对训练集中的所有训练样本进行批量迭代训练,输出训练好的情感原因三元组抽取模型。
步骤3.3:使用步骤3.2中训练好的抽取模型,输入任意文档,输出抽取出的情感原因三元组。
步骤4:以用户要表达情感的对象(如用户关注的某件商品)的相关文档作为输入,利用该对象不同方面的关键词(如:该件商品的特征等),匹配所有情感原因三元组中的句子。若句子中存在对应关键词,则表示此情感原因三元组与关键词相关。
进一步地,可以通过可视化的方式,展示出用户对于要表达情感的对象情感类型的具体原因(三元组中的情感句与原因句)。
有益效果
与现有技术相比,本发明具有以下优点:
1.本方法克服了情感原因对抽取结果实用性较低、应用场景受限的缺点,同时抽取出情感句、原因句以及情感类型三元组(情感原因三元组)。
2.本方法解决了现有情感原因对抽取方法存在的错误传播、使用复杂、耗时等缺点,提出了一种基于双仿射的抽取方法,实现了情感原因三元组端到端的抽取。
3.本方法改进了现有评论方式分类粒度较粗、信息过多等问题,可以很好的提高用户的使用体验。
附图说明
图1是本发明所述一种评论情感原因三元组抽取方法的流程图;
图2是用户使用传统的基于好评差评分类的评论示意图;
图3是用户使用传统的基于关键字抽取的评论示意图;
图4是用户使用本发明方法的评论示意图。
具体实施方式
下面结合附图和实施例,对本发明方法作进一步详细描述。
实施例
一种评论情感原因三元组抽取方法,包括以下步骤:
步骤1:标记数据集中每个文档中的情感原因对并标记情感句的情感类型。使用中文分词工具jieba进行分词,词与词之间用空格隔开。
例如:下列文档:
电脑 刚刚 到货 了, 1
迫不及待 地 打开 来 试一试。 2
外形 真是 惊艳 到 我 了, 3
又 薄 又 有 科技感, 4
比 图片 上 展示 的 还 漂亮。 5
使用 了 一下 总体 是 不错 的, 6
但是 使用 的 时候 有一些 小 问题, 7
风扇 的 声音 很 大, 8
有点 烦人。 9
其中,第3句为情感句,情感类型为惊喜,其对应的原因句为第4、第5句。第9句为情感句,情感类型为厌恶,其对应的原因句为第7、第8句。对应的标注为(3,4,1)(3,5,1)(9,7,2)(9,8,2),其中,惊喜用1标注,厌恶用2标注。
步骤2:将数据集划分为训练集和测试集,训练集用来进行模型的训练,测试集用来测试模型的性能;
步骤3:利用skip-gram算法训练好的300维词向量得到训练集中每一个词的词向量cm,若训练好的词向量不存在文档中的某个词,则采用随机初始化相同维度的词向量来表示;
步骤4:利用步骤3得到的词向量cm作为双向LSTM与attention模型的输入对句子进行编码得到每个句子的句向量sn
步骤5:以句向量sn为输入,采用两个全连接网络分别得到表示情感的向量
Figure BDA0003226897410000061
与表示原因的向量
Figure BDA0003226897410000062
利用双仿射注意力机制对向量
Figure BDA0003226897410000063
Figure BDA0003226897410000064
之间的关系进行建模,得到三维概率矩阵
Figure BDA0003226897410000065
如对步骤1的文档经过以上步骤后会得到9*9*4的三位概率矩阵,9为句子数,4为四种情感类型;其中每一位都是0到1的值,表示概率;
步骤6:采用二元交叉熵衡量真实概率Yp,q,r与模型预测概率
Figure BDA0003226897410000071
之间分布的差异性,并以此为模型的目标函数L进行训练,如:步骤1中文档的真实概率为:(3,4,1)(3,4,1)(9,7,2)(9,8,2)四个位置为1,其余位置为0,表示这四个位置存在情感原因三元组需要抽取:
步骤7:使用批量随机梯度下降方法对步骤6的目标函数进行优化,对训练集中的所有训练样本进行批量迭代训练,得到训练好的情感原因三元组抽取模型;
步骤8:使用步骤7中得到的训练好的抽取模型,输入任意的文档,输出抽取出的情感原因三元组;
例如,谈论同一手机两个文档:
1.之前的手机坏了,所以想换一个新的。挑选了很久最终选择了这一款。手机屏幕很不错,分辨率和刷新率都很高,而且屏占比超高。拍照功能是我最喜欢的,光学变焦和防抖功能都很实用,夜间拍摄的质量真的震撼到我了。但是摄像头是突出的有点不太好,很容易磕碰之类的。
2.第一次用这个牌子的手机。屏幕各方面素质都不错,但是有一点不好的是,硬度不太够,很容易摔碎。这么好的手机屏幕摔了就有些可惜了。摄像头改为了圆形我很喜欢,很漂亮也与其他手机有很好的区分度。
上述文档1中模型会抽取出“手机屏幕很不错-分辨率和刷新率都很高–高兴”,“手机屏幕很不错-而且屏占比超高–高兴”,“拍照功能是我最喜欢的-光学变焦和防抖功能都很实用–高兴”,“拍照功能是我最喜欢的-夜间拍摄的质量真的震撼到我了–高兴”以及“但是摄像头是突出的有点不太好-很容易磕碰之类的–厌恶”共5个情感原因三元组;文档2中模型会抽取出“但是有一点不好的是-硬度不太够–厌恶”,“但是有一点不好的是-很容易摔碎–厌恶”以及“摄像头改为了圆形我很喜欢-很漂亮也与其他手机有很好的区分度–高兴”共3个情感原因三元组;
步骤9:匹配到步骤8提取出的三元组的情感句中有“屏幕”、“拍照”、“摄像头”三个关键词;
步骤10:按照关键字对原因句进行分类,包含相同关键字的句子(即描述商品同一方面的句子)属于同一类。
进一步地,可以采用可视化方式,展示出用户对于商品某方面(即关键字)喜爱(情感类型为高兴与惊喜)或者不喜爱(情感类型为厌恶与愤怒)的具体原因(三元组中的情感句与原因句)。
对于上述两个文档,喜爱屏幕的原因为:分辨率和刷新率都很高,而且屏占比超高,不喜爱屏幕的原因为:硬度不太够,很容易摔碎。
对于用户或者买家来说,根据以上信息,他们可以快速的了解商品各方面的优缺点,并且根据自己的需求选择是否购买此款商品。如有些人比较粗心,经常将手机摔下,则有可能不会选购上述的手机,有一些人对于屏幕的分辨率等很看重,使用手机也很小心,则有可能会选购。
对于商户或者卖家来说,根据以上信息,可以快速的了解消费者对于商品各部分的评价以及喜爱或者不喜爱的原因。有了这些信息,商家就可以做出相应的决策,如有很多人更在意屏幕的硬度不够,则商家可以选择改进:采用硬度更高的屏幕,甚至牺牲一点屏幕的性能;再如很多人很喜爱摄像头圆形的设计,则可以保持这一设计,并作为宣传点之一。
图2展示了基于好评差评分类的评论示意图,图片上部的“好评”,“差评”等为不同的分类标签,分类标签是基于用户所给出的评分、星级等确定的,评分高、星级高则为好评,反之则为差评;点击具体标签后会展示相应分类的不同用户的评论全文;
图3展示了基于关键词抽取的评论示意图,图片上部的“好看”,“电池耐用”等为不同的分类标签,分类标签是基于用户评论中所抽取出的常见的关键词所确定的,与此关键词有关的评论无论好差评均会展示;点击具体标签后会展示相应分类的不同用户的评论全文;
图4展示了采用本发明方法的评论示意图,图片上部的分类标签分为两部分,上半部分的“屏幕”“摄像头”等为商品的某个特征、部分标签,通过关键词与抽取出的情感原因三元组中句子匹配得到;下半部分的“高兴”“惊喜”等标签为用户对于此商品的情感类型,同一用户对于同一商品可以体现不同的情感类型,如用户A***rew对“屏幕”表达出高兴的情感,但是却对“摄像头”表达出厌恶的情感,这样可以更加细粒度的展示评论所包含的信息;本发明展示更加浓缩的信息,即只展示用户评论中的情感句以及原因句,而不是全文,这样可以过滤掉很多与商品选择无关的话语;同时,我们也给出了“显示原文”选项,使得用户也可以选择查看全文;点击具体标签后会展示相应分类的不同用户评论中的情感句与原因句;
以上所述为本发明的较佳实施例而已,其中的情感类型不局限于高兴、惊喜、厌恶、愤怒四类,任意情感类型均适用于本发明。
本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。

Claims (5)

1.一种评论情感原因三元组抽取方法,其特征在于,首先,提出<情感-原因-情感类型>的情感原因三元组:从文档中同时抽取出情感句、与情感句对应的原因句和情感类型;之后,利用深度学习模型和双仿射注意力机制建模情感句、原因句以及情感类型之间的联系,得到情感原因三元组的三维概率矩阵;根据三维概率矩阵训练模型,以任意文档作为输入,抽取出情感原因三元组;最后,将用户要表达情感的对象与所有情感原因三元组中的句子进行关键词匹配,若句子中存在对应关键词,则表示此情感原因三元组与关键词相关。
2.如权利要求1所述的一种评论情感原因三元组抽取方法,其特征在于,具体包括以下步骤:
步骤1:设计抽取情感原因三元组的模型,包括以下步骤:
步骤1.1:输入数据集中的每个文档,输出标注情感原因三元组后的数据集;其中,数据集包括训练集和测试集;
步骤1.2:从步骤1.1输出的数据集中,选择训练文档W;
每个W中包含n个句子S,每个句子S中包含m个词C;其中,文档W个数的范围为1到K,共K个训练文档;
步骤1.3:对步骤1.2得到的训练文档的句子进行编码,得到句向量sn
步骤2:利用双仿射注意力机制建模情感句、原因句和情感类型之间的联系,得到情感原因三元组的三维概率矩阵,包括以下子步骤:
步骤2.1:利用两个全连接网络,对步骤1中得到的句向量sn进行维度压缩,除去冗余信息,分别得到情感句向量
Figure FDA0003226897400000011
和原因句向量
Figure FDA0003226897400000012
步骤2.2:利用双仿射注意力机制建模情感句向量
Figure FDA0003226897400000013
原因句向量
Figure FDA0003226897400000014
和情感类型之间的联系;
采用式5得到一个三维的矩阵Up,q,r,三个维度分别表示情感句、原因句和情感类型:
Figure FDA0003226897400000015
其中,
Figure FDA0003226897400000016
Figure FDA0003226897400000017
为可训练参数,
Figure FDA0003226897400000018
分别为第p个情感句向量、第q个原因句向量;T表示转置操作;
矩阵Up,q,r中,每一位经过sigmoid函数后,输出0到1的值,表示此位是情感原因三元组的概率,sigmoid函数如式6所示:
Figure FDA0003226897400000019
其中,sigmoid(·)表示归一化,将矩阵U中每一位归一化为0到1的值,以此来表示概率;
Figure FDA0003226897400000021
为最终得到的情感三维矩阵中第p个情感句、第q个原因句、第r个情感类型需要抽取的三元组的概率值;
此处,设置一个阈值0.5,凡是大于该阈值的概率值,认为是需要抽取出的情感原因三元组,反之不需要抽取;
步骤3:根据步骤2得到的三维概率矩阵训练模型,以任意文档作为输入,抽取出情感原因三元组,包括以下步骤:
步骤3.1:采用二元交叉熵衡量真实概率Yp,q,r与模型预测概率
Figure FDA0003226897400000022
之间分布的差异性,并以此为模型的目标函数L进行训练,如式7所示:
Figure FDA0003226897400000023
其中,真实概率Yp,q,r是指情感原因三元组标签的概率,是情感原因三元组则概率为1,否则为0;∑p,q,r表示对不同p、q、r二元交叉熵结果的加和;
步骤3.2:使用批量随机梯度下降方法,对步骤3.1的目标函数进行优化,对训练集中的所有训练样本进行批量迭代训练,输出训练好的情感原因三元组抽取模型;
步骤3.3:使用步骤3.2中训练好的抽取模型,输入任意文档,输出抽取出的情感原因三元组;
步骤4:以用户要表达情感的对象的相关文档作为输入,利用该对象不同方面的关键词,匹配所有情感原因三元组中的句子;若句子中存在对应关键词,则表示此情感原因三元组与关键词相关。
3.如权利要求2所述的一种评论情感原因三元组抽取方法,其特征在于,步骤1.1包括以下步骤:
首先,对数据集中每个文档中的句子进行分词,词与词之间用空格隔开;
然后,对数据集中的每个文档,标注出所包含的情感原因对;
最后,对数据集中每个文档中的情感句,标注出其情感类型。
4.如权利要求2所述的一种评论情感原因三元组抽取方法,其特征在于,步骤1.3包括以下步骤:
步骤1.3.1:利用式1的词嵌入函数,将句子的每个词Cm转换为词嵌入向量cm
cm=embed(Cm) (1)
其中,embed(·)是嵌入函数;对于输入的每一个词Cm,在训练好的词嵌入向量表中查找得到对应的词嵌入向量cm
步骤1.3.2:利用式2、3、4,将步骤1.3.1中得到的词嵌入向量cm作为深度学习模型,即双向长短期记忆神经网络LSTM与attention的输入,建模词与词之间的上下文关系,得到每个句子的句向量sn
Figure FDA0003226897400000031
scorej=vTtanh(W′hm) (3)
Figure FDA0003226897400000032
其中,
Figure FDA0003226897400000033
分别表示前向和后向的LSTM;hm
Figure FDA0003226897400000034
拼接了前向和后向LSTM输出后的向量;scorej为attention机制输出的分数,vT、W′均为可训练参数,T表示转置操作;softmax(·)为归一化函数,限制输出结果总和为1;M表示单词个数。
5.如权利要求2所述的一种评论情感原因三元组抽取方法,其特征在于,步骤4之后,进一步通过可视化的方式,展示出用户对于要表达情感的对象情感类型的具体原因。
CN202110973766.8A 2021-08-24 2021-08-24 一种评论情感原因三元组抽取方法 Active CN113779245B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110973766.8A CN113779245B (zh) 2021-08-24 2021-08-24 一种评论情感原因三元组抽取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110973766.8A CN113779245B (zh) 2021-08-24 2021-08-24 一种评论情感原因三元组抽取方法

Publications (2)

Publication Number Publication Date
CN113779245A true CN113779245A (zh) 2021-12-10
CN113779245B CN113779245B (zh) 2024-09-10

Family

ID=78839205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110973766.8A Active CN113779245B (zh) 2021-08-24 2021-08-24 一种评论情感原因三元组抽取方法

Country Status (1)

Country Link
CN (1) CN113779245B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114610905A (zh) * 2022-03-23 2022-06-10 腾讯科技(深圳)有限公司 一种数据处理方法及相关装置
CN115203412A (zh) * 2022-07-06 2022-10-18 腾讯科技(深圳)有限公司 情感观点信息分析方法、装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN110162636A (zh) * 2019-05-30 2019-08-23 中森云链(成都)科技有限责任公司 基于d-lstm的文本情绪原因识别方法
CN110517121A (zh) * 2019-09-23 2019-11-29 重庆邮电大学 基于评论文本情感分析的商品推荐方法及商品推荐装置
CN112926337A (zh) * 2021-02-05 2021-06-08 昆明理工大学 一种结合重构句法信息的端到端方面级情感分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108363753A (zh) * 2018-01-30 2018-08-03 南京邮电大学 评论文本情感分类模型训练与情感分类方法、装置及设备
CN110162636A (zh) * 2019-05-30 2019-08-23 中森云链(成都)科技有限责任公司 基于d-lstm的文本情绪原因识别方法
CN110517121A (zh) * 2019-09-23 2019-11-29 重庆邮电大学 基于评论文本情感分析的商品推荐方法及商品推荐装置
CN112926337A (zh) * 2021-02-05 2021-06-08 昆明理工大学 一种结合重构句法信息的端到端方面级情感分析方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHEN ZHANG 等: "A Multi-task Learning Framework for Opinion Triplet Extraction", RXIV:2010.01512V2 [CS.CL], 31 October 2020 (2020-10-31) *
张亚洲 等: "多模态情感分析研究综述", 模式识别与人工智能, 31 May 2020 (2020-05-31) *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114610905A (zh) * 2022-03-23 2022-06-10 腾讯科技(深圳)有限公司 一种数据处理方法及相关装置
CN114610905B (zh) * 2022-03-23 2024-04-26 腾讯科技(深圳)有限公司 一种数据处理方法及相关装置
CN115203412A (zh) * 2022-07-06 2022-10-18 腾讯科技(深圳)有限公司 情感观点信息分析方法、装置、存储介质及电子设备
CN115203412B (zh) * 2022-07-06 2024-02-20 腾讯科技(深圳)有限公司 情感观点信息分析方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN113779245B (zh) 2024-09-10

Similar Documents

Publication Publication Date Title
CN109933664B (zh) 一种基于情感词嵌入的细粒度情绪分析改进方法
CN111985369A (zh) 基于跨模态注意力卷积神经网络的课程领域多模态文档分类方法
Lenz et al. Measuring the diffusion of innovations with paragraph vector topic models
CN111966917A (zh) 一种基于预训练语言模型的事件检测与摘要方法
CN111368075A (zh) 文章质量预测方法、装置、电子设备及存储介质
CN111159367B (zh) 一种信息处理方法及相关设备
CN112559683A (zh) 基于多模态数据及多交互记忆网络的方面级情感分析方法
CN111309936A (zh) 一种电影用户画像的构建方法
CN113779245B (zh) 一种评论情感原因三元组抽取方法
CN113627550A (zh) 一种基于多模态融合的图文情感分析方法
CN113535949B (zh) 基于图片和句子的多模态联合事件检测方法
CN112364168A (zh) 一种基于多属性信息融合的舆情分类方法
CN103473380A (zh) 一种计算机文本情感分类方法
CN114693397A (zh) 一种基于注意力神经网络的多视角多模态商品推荐方法
CN112712127A (zh) 一种结合图卷积神经网络的图像情感极性分类方法
CN112131345A (zh) 文本质量的识别方法、装置、设备及存储介质
Gandhi et al. Multimodal sentiment analysis: review, application domains and future directions
Papadaki Data augmentation techniques for legal text analytics
CN115510326A (zh) 基于文本特征和情感倾向的网络论坛用户兴趣推荐算法
CN115588122A (zh) 一种基于多模态特征融合的新闻分类方法
Zeng et al. Cross-domain text sentiment classification method based on the CNN-BiLSTM-TE model
Biswas et al. A new ontology-based multimodal classification system for social media images of personality traits
CN114443846A (zh) 一种基于多层级文本异构图的分类方法、装置及电子设备
Purba et al. A hybrid convolutional long short-term memory (CNN-LSTM) based natural language processing (NLP) model for sentiment analysis of customer product reviews in Bangla
CN113449103A (zh) 融入标签与文本交互机制的银行交易流水分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant