CN114266241A - 基于文本和情感极性的评论有用性预测方法、设备及介质 - Google Patents

基于文本和情感极性的评论有用性预测方法、设备及介质 Download PDF

Info

Publication number
CN114266241A
CN114266241A CN202210000533.4A CN202210000533A CN114266241A CN 114266241 A CN114266241 A CN 114266241A CN 202210000533 A CN202210000533 A CN 202210000533A CN 114266241 A CN114266241 A CN 114266241A
Authority
CN
China
Prior art keywords
comment
vector
loss function
usefulness
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210000533.4A
Other languages
English (en)
Inventor
江岭
黄鹏
王思宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Xiaoduo Technology Co ltd
Original Assignee
Chengdu Xiaoduo Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Xiaoduo Technology Co ltd filed Critical Chengdu Xiaoduo Technology Co ltd
Priority to CN202210000533.4A priority Critical patent/CN114266241A/zh
Publication of CN114266241A publication Critical patent/CN114266241A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供基于文本和情感极性的评论有用性预测方法、设备及介质,方法如下,获取评论数据,对所述评论数据进行编码处理,所述编码处理包括基于词级注意力机制对评论词进行编码获取评论词所在评论句子的表示向量,以及基于句子级注意力机制对评论句子进行编码获取评论的表示向量;将评论的表示向量送入预测模型的两个全连接层,分别获取评论的有用性预测概率和评论情感极性预测概率,并基于交叉熵损失函数构建评论有用性概率预测的第一损失函数和评论情感极性概率预测的第二损失函数,再对所述第一损失函数与第二损失函数进行优化;本申请将评论内容与评论的情感极性结合,通过多任务学习的方式进行模型训练,实现高效率的评论有用性预测。

Description

基于文本和情感极性的评论有用性预测方法、设备及介质
技术领域
本发明涉及自然语言处理技术领域,具体而言,涉及基于文本和情感极性的评论有用性预测方法、设备及介质。
背景技术
网上购物时用户无法直接接触到商品,只能通过图片或商品介绍来了解商品。但这些信息是有限的,消费者在做出购买决定之前,难以从多个角度了解商品;因此商品的评论成为用户了解商品的一个最为重要的渠道。毫无疑问,评论是电子商务网站中宝贵的财富,其中不仅包含了用户对商品特征的详细描述,还囊括了商品或服务的改进意见。
然而,随着电商网站商品和评论的增加,消费者需要花费大量精力去区分评论的质量,这显然是一项耗时且费力的工作,同时大大影响了用户体验。另一方面,企业也希望从评论中获得用户有价值的反馈信息,用于改进商品或服务,提升竞争力在未来的竞争中获得成功,这也是电子商务客户服务的一项关键工作。高质量的评论是反馈信息的重要来源,然而由于评论数量大,质量良莠不齐,这些问题也大大影响了企业从评论中获取信息的效率和质量,由此给电子商务客户服务带来了诸多困难。
因此,能够自动预测评论的有用性将会是一件非常有意义的工作。目前的研究主要是从评论的内容入手,现有的研究团队认为评论内容丰富则将会是比较有用的。但通过大量阅读评论发现,大部分有价值的评论的情感极性是极度正面或者负面的。换句话说,当用户认为一个商品比较好或比较差时,他们更有可能写出有价值的评论。因此,本申请从这个角度入手,将评论的内容和评论的情感极性结合起来用以预测评论的有用性。
发明内容
本发明的目的在于提供基于文本和情感极性的评论有用性预测方法、设备及介质,其通过将评论内容与评论的情感极性相结合,并通过多任务学习的方式进行模型训练,高效的获取进行了评论的有用性预测;同时通过对评论表示向量的分类,进一步提高了评论有用性预测的效率。
本发明的实施例通过以下技术方案实现:
第一方面,提供基于文本和情感极性的评论有用性预测方法,包括如下步骤,
获取评论数据,并对所述评论数据进行编码处理,所述编码处理包括基于词级注意力机制对评论词进行编码获取评论词所在评论句子的表示向量,以及基于句子级注意力机制对评论句子进行编码获取评论的表示向量
Figure 518282DEST_PATH_IMAGE002
将评论的表示向量
Figure 602912DEST_PATH_IMAGE002
送入预测模型的两个全连接层,分别获取评论的有用性预测概率和评论情感极性预测概率,并基于交叉熵损失函数构建评论有用性概率预测的第一损失函数和评论情感极性概率预测的第二损失函数,再对所述第一损失函数与第二损失函数进行优化。
进一步的,所述基于词级注意力机制对评论词进行编码获取评论词所在评论句子的表示向量,包括:
获取评论句子中词的序列
Figure DEST_PATH_IMAGE003
,其中l∈[1,L],L表示评论中有L条评论句子,T表示评论句子l中词的数量,通过词嵌入矩阵
Figure 506277DEST_PATH_IMAGE004
得到词
Figure DEST_PATH_IMAGE005
的表示向量
Figure 297647DEST_PATH_IMAGE006
,其中m为词典中词的综述,
Figure DEST_PATH_IMAGE007
为表示词向量维度的参数,
Figure 221741DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE009
,再将评论句子l中的词向量序列
Figure 731350DEST_PATH_IMAGE010
送入第一双向GRU网络中,其中第一时间步的计算如下式(1)、(2)所示,
Figure DEST_PATH_IMAGE011
(1)
Figure 907248DEST_PATH_IMAGE012
(2)
通过式(1)、(2)得到两个隐状态
Figure DEST_PATH_IMAGE013
Figure 553124DEST_PATH_IMAGE014
,再拼接两个隐状态得到第一双向GRU网络的第一时间步的输出
Figure DEST_PATH_IMAGE015
,其中,第一时间步表示评论词;
Figure 913698DEST_PATH_IMAGE016
送入第一多层感知机得到向量
Figure DEST_PATH_IMAGE017
,如下式(3)所示,
Figure 379446DEST_PATH_IMAGE018
(3)
其中,
Figure DEST_PATH_IMAGE019
为可学习的参数,
Figure 359034DEST_PATH_IMAGE020
为待学习的随机初始化的向量参数;
再计算向量
Figure 311947DEST_PATH_IMAGE017
的转置向量
Figure DEST_PATH_IMAGE021
与向量
Figure 453209DEST_PATH_IMAGE022
的内积,再通过softmax函数得到每个第一时间步基于词级注意力机制输出的权重
Figure DEST_PATH_IMAGE023
,如下式(4)所示,
Figure 530887DEST_PATH_IMAGE024
(4)
其中,
Figure DEST_PATH_IMAGE025
为待学习的随机初始化的向量参数;
最后通过加权求和每个第一时间步输出得到句子l的表示向量
Figure 48587DEST_PATH_IMAGE026
,如下式(5)所示,
Figure DEST_PATH_IMAGE027
(5)。
进一步的,所述基于句子级注意力机制对评论句子进行编码获取评论的表示向量,包括:
获取评论中评论句子的表示向量集合
Figure 262531DEST_PATH_IMAGE028
,将向量集合
Figure DEST_PATH_IMAGE029
输入第二双向GRU网络中,其中第二时间步的计算如下式(6)、(7)所示,
Figure 840273DEST_PATH_IMAGE030
(6)
Figure DEST_PATH_IMAGE031
(7)
通过式(6)、(7)得到两个隐状态
Figure 280613DEST_PATH_IMAGE032
Figure DEST_PATH_IMAGE033
,再拼接两个隐状态得到第二双向GRU网络的第二时间步的输出
Figure 461059DEST_PATH_IMAGE034
,其中,第二时间步表示评论句子;
Figure DEST_PATH_IMAGE035
送入第一多层感知机得到向量
Figure 936034DEST_PATH_IMAGE036
,如下式(8)所示,
Figure DEST_PATH_IMAGE037
(8)
其中,
Figure 543733DEST_PATH_IMAGE038
为可学习的参数,
Figure DEST_PATH_IMAGE039
为待学习的随机初始化的向量参数;
再计算向量
Figure 471368DEST_PATH_IMAGE040
的转置向量
Figure DEST_PATH_IMAGE041
与向量
Figure 455505DEST_PATH_IMAGE042
的内积,再通过softmax函数得到每个第二时间步基于句子级注意力机制输出的权重
Figure DEST_PATH_IMAGE043
,如下式(9)所示,
Figure 50565DEST_PATH_IMAGE044
(9)
其中,
Figure 298007DEST_PATH_IMAGE042
为待学习的随机初始化的向量参数;
最后通过加权求和每个第二时间步输出得到评论的表示向量
Figure 40835DEST_PATH_IMAGE002
,如下式(10)所示,
Figure DEST_PATH_IMAGE045
(10)。
进一步的,所述评论的有用性预测概率的获取如下式(11)所示,
Figure 438450DEST_PATH_IMAGE046
(11)
其中,
Figure DEST_PATH_IMAGE047
为评论的有用性预测概率,
Figure 747071DEST_PATH_IMAGE048
为可学习的参数。
进一步的,所述评论情感极性预测概率采用softmax函数获取概率分布,如下式(12)所示,
Figure DEST_PATH_IMAGE049
(12)
其中,
Figure 837518DEST_PATH_IMAGE050
为评论情感极性预测概率,
Figure DEST_PATH_IMAGE051
为可学习的参数。
进一步的,构建评论有用性概率预测的第一损失函数为,采用二元交叉熵损失函数构建第一损失函数
Figure 598801DEST_PATH_IMAGE052
,如下式(13)所示,
Figure DEST_PATH_IMAGE053
(13)
其中,C为训练用评论数据集, C∈(n 1 ,n 2 ,…,n K ),k∈[1,K],
Figure 800106DEST_PATH_IMAGE054
为表示评论有用性的真实标签;
构建评论情感极性概率预测的第二损失函数为,采用多元交叉熵损失函数构建第二损失函数
Figure DEST_PATH_IMAGE055
,如下式(14)所示,
Figure 346321DEST_PATH_IMAGE056
(14)
其中,
Figure DEST_PATH_IMAGE057
为表示评论情感极性的真实标签;
所述对所述第一损失函数与第二损失函数进行优化如下式(15)所示,
Figure 466724DEST_PATH_IMAGE058
(15)
其中,
Figure DEST_PATH_IMAGE059
为所述预测模型的损失函数,θ为可学习的参数。
进一步的,在将评论的表示向量
Figure 590669DEST_PATH_IMAGE002
送入预测模型之前还包括,将所有评论的表示向量基于相似度进行分类,在被分在同一类的评论中选取一条评论,用被选择评论的表示向量代表其所在的评论分类进行评论的有用性预测以及评论情感极性预测。
进一步的,所述将所有评论的表示向量基于相似度进行分类包括,预设相似度阈值区间,当两条评论的向量相似度位于所述相似度阈值区间时,两条评论判定为同一分类。
第二方面,提供一种电子设备,包括:至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的基于文本和情感极性的评论有用性预测方法。
第三方面,一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的基于文本和情感极性的评论有用性预测方法。
本发明实施例的技术方案至少具有如下优点和有益效果:
本申请通过将评论内容与评论的情感极性相结合,并通过多任务学习的方式进行模型训练,高效的获取进行了评论的有用性预测;同时通过对评论表示向量的分类,进一步提高了评论有用性预测的效率。
附图说明
图1为本发明实施例1提供方法流程示意图;
图2为本发明实施例2提供方法流程示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
网络购物的评论是购买者了解商品的有用信息之一,也是商家了解用户反馈的重要渠道,但是目前存在大量的刷评论以及无用评论,获取有用评论愈发的困难,基于此,本申请期望通过评论文本与评论的情感极性相结合,并采用多任务学习的方式得到评论有用性预测模型,进而能够在大量评论中快速高效的筛选出有用的评论。
实施例1
本实施例提供基于文本和情感极性的评论有用性预测方法,包括如下步骤,
获取评论数据,并对所述评论数据进行编码处理,所述编码处理包括基于词级注意力机制对评论词进行编码获取评论词所在评论句子的表示向量;其中,所述基于词级注意力机制对评论词进行编码获取评论词所在评论句子的表示向量,包括:
获取评论句子中词的序列
Figure 923561DEST_PATH_IMAGE003
,其中l∈[1,L],L表示评论中有L条评论句子,T表示评论句子l中词的数量,通过词嵌入矩阵
Figure 675617DEST_PATH_IMAGE004
得到词
Figure 435762DEST_PATH_IMAGE005
的表示向量
Figure 233954DEST_PATH_IMAGE006
,其中其中m为词典中词的综述,
Figure 104958DEST_PATH_IMAGE007
为表示词向量维度的参数,
Figure 711520DEST_PATH_IMAGE060
Figure 376988DEST_PATH_IMAGE009
,再将评论句子l中的词向量序列
Figure 928055DEST_PATH_IMAGE010
送入第一双向GRU网络中,其中第一时间步的计算如下式(1)、(2)所示,
Figure 602750DEST_PATH_IMAGE011
(1)
Figure 63818DEST_PATH_IMAGE012
(2)
通过式(1)、(2)得到两个隐状态
Figure 634608DEST_PATH_IMAGE013
Figure 813916DEST_PATH_IMAGE014
,再拼接两个隐状态得到第一双向GRU网络的第一时间步的输出
Figure 151357DEST_PATH_IMAGE015
,其中,第一时间步表示评论词;
Figure 607877DEST_PATH_IMAGE016
送入第一多层感知机得到向量
Figure 677464DEST_PATH_IMAGE017
,如下式(3)所示,
Figure 78490DEST_PATH_IMAGE018
(3)
其中,
Figure DEST_PATH_IMAGE061
为可学习的参数,
Figure 563829DEST_PATH_IMAGE020
为待学习的随机初始化的向量参数;
再计算向量
Figure 468331DEST_PATH_IMAGE017
的转置向量
Figure 177661DEST_PATH_IMAGE021
与向量
Figure 800403DEST_PATH_IMAGE025
的内积,再通过softmax函数得到每个第一时间步基于词级注意力机制输出的权重
Figure 355012DEST_PATH_IMAGE023
,如下式(4)所示,
Figure 504234DEST_PATH_IMAGE062
(4)
其中,
Figure 118886DEST_PATH_IMAGE025
为待学习的随机初始化的向量参数;
最后通过加权求和每个第一时间步输出得到句子l的表示向量
Figure 228925DEST_PATH_IMAGE026
,如下式(5)所示,
Figure 852804DEST_PATH_IMAGE027
(5)。
所述编码处理还包括基于句子级注意力机制对评论句子进行编码获取评论的表示向量
Figure 731898DEST_PATH_IMAGE002
,具体包括:
获取评论中评论句子的表示向量集合
Figure 642085DEST_PATH_IMAGE028
,将向量集合
Figure 239420DEST_PATH_IMAGE029
输入第二双向GRU网络中,其中第二时间步的计算如下式(6)、(7)所示,
Figure 135832DEST_PATH_IMAGE030
(6)
Figure 400591DEST_PATH_IMAGE031
(7)
通过式(6)、(7)得到两个隐状态
Figure 91467DEST_PATH_IMAGE032
Figure DEST_PATH_IMAGE063
,再拼接两个隐状态得到第二双向GRU网络的第二时间步的输出
Figure 379360DEST_PATH_IMAGE034
,其中,第二时间步表示评论句子;
Figure 345042DEST_PATH_IMAGE035
送入第一多层感知机得到向量
Figure 464307DEST_PATH_IMAGE040
,如下式(8)所示,
Figure 716297DEST_PATH_IMAGE037
(8)
其中,
Figure 288224DEST_PATH_IMAGE038
为可学习的参数,
Figure 792017DEST_PATH_IMAGE039
为待学习的随机初始化的向量参数;
再计算向量
Figure 765790DEST_PATH_IMAGE036
的转置向量
Figure 329626DEST_PATH_IMAGE064
与向量
Figure 388849DEST_PATH_IMAGE042
的内积,再通过softmax函数得到每个第二时间步基于句子级注意力机制输出的权重
Figure 430754DEST_PATH_IMAGE043
,如下式(9)所示,
Figure 524612DEST_PATH_IMAGE065
(9)
其中,
Figure 259350DEST_PATH_IMAGE042
为待学习的随机初始化的向量参数;
最后通过加权求和每个第二时间步输出得到评论的表示向量
Figure 540290DEST_PATH_IMAGE002
,如下式(10)所示,
Figure 385886DEST_PATH_IMAGE045
(10)。
获取所有评论的表示向量
Figure 334251DEST_PATH_IMAGE002
之后,将评论的表示向量
Figure 98944DEST_PATH_IMAGE002
送入预测模型的两个全连接层,分别获取评论的有用性预测概率和评论情感极性预测概率;其中,所述评论的有用性预测概率的获取如下式(11)所示,
Figure 867180DEST_PATH_IMAGE046
(11)
其中,
Figure 516467DEST_PATH_IMAGE047
为评论的有用性预测概率,
Figure 53759DEST_PATH_IMAGE048
为可学习的参数。
由于评论的情感极性对评论有用性预测具有帮助,即评论越是正面或负面,其有用的概率越大,因此我们希望评论的表示向量中能包括评论情感极性的信息,因此我们将评论的表示向量送入预测模型的一全连接层计算情感极性预测概率,具体如下。
所述评论情感极性预测概率采用softmax函数获取概率分布,如下式(12)所示,
Figure 130299DEST_PATH_IMAGE049
(12)
其中,
Figure 651411DEST_PATH_IMAGE050
为评论情感极性预测概率,
Figure 838809DEST_PATH_IMAGE051
为可学习的参数。
再基于交叉熵损失函数构建评论有用性概率预测的第一损失函数和评论情感极性概率预测的第二损失函数;其中,构建评论有用性概率预测的第一损失函数具体为,采用二元交叉熵损失函数构建第一损失函数
Figure 496187DEST_PATH_IMAGE052
,如下式(13)所示,
Figure 743629DEST_PATH_IMAGE053
(13)
其中,C为训练用评论数据集, C∈(n 1 ,n 2 ,…,n K ),k∈[1,K],
Figure 611090DEST_PATH_IMAGE054
为表示评论有用性的真实标签;
构建评论情感极性概率预测的第二损失函数具体为,采用多元交叉熵损失函数构建第二损失函数
Figure 602180DEST_PATH_IMAGE055
,如下式(14)所示,
Figure 379643DEST_PATH_IMAGE056
(14)
其中,
Figure 532407DEST_PATH_IMAGE057
为表示评论情感极性的真实标签;
最后再对所述第一损失函数与第二损失函数进行优化如下式(15)所示,
Figure 762531DEST_PATH_IMAGE058
(15)
其中,
Figure 291733DEST_PATH_IMAGE059
为所述预测模型的损失函数,θ为可学习的参数。
实施例2
在本实施例在实施例1的基础上,考虑了如何增加预测效率的问题,由于很多低质量评论是通过复制粘贴评论的,因此存在大量的评论相同或相似度极高,因此我们可以提前将评论的表示向量进行分类,进而可以将相同或相似度极高的评论归在一个分类中,预测时仅需预测一个分类中的某一个评论即可,即用分类中的一个评论的有用性预测概率来代表该分类的有用性预测概率。
本实施例的具体实施方式如下,在将评论的表示向量
Figure 658123DEST_PATH_IMAGE002
送入预测模型之前,将所有评论的表示向量基于相似度进行分类,在被分在同一类的评论中选取一条评论,用被选择评论的表示向量代表其所在的评论分类进行评论的有用性预测以及评论情感极性预测。
可以知晓的是,上述分类可以采用的方法包括:余弦相似度、欧式距离、汉明距离等;将所有的评论的表示向量通过上述方法之一进行分类。
另外需要说明的是,当多个评论的向量相同时,即为相同评论,相同评论必定被分在同一分类中,但是对于相似的评论,其相似度是作为其分类的依据,由于本申请的分类有别于对异常的筛选分类,因此在本申请中,会预设相似度阈值区间,当两条评论的向量相似度位于所述相似度阈值区间时,两条评论判定为同一分类。
如采用余弦相似度进行分类时,当两评论的表示向量的余弦取值在[0.95~1]中时,则被判定为同一分类,其中[0.95~1]为相似度阈值区间;可以知晓的是,相似度阈值区间可根据实际情况进行预设。
当采用欧式距离时,当两评论的表示向量的距离在[0~0.05]中时,则被判定为同一分类,其中[0~0.05]为相似度阈值区间;同样,此时相似度阈值区间可根据实际情况进行预设。
实施例3
本实施例提供一种电子设备,包括:至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行实施例1或实施例2所述的基于文本和情感极性的评论有用性预测方法。
实施例4
本实施例提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现实施例1或实施例2所述的基于文本和情感极性的评论有用性预测方法。
本申请通过将评论内容与评论的情感极性相结合,并通过多任务学习的方式进行模型训练,高效的获取进行了评论的有用性预测;同时通过对评论表示向量的分类,进一步提高了评论有用性预测的效率。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.基于文本和情感极性的评论有用性预测方法,其特征在于,包括如下步骤,
获取评论数据,并对所述评论数据进行编码处理,所述编码处理包括基于词级注意力机制对评论词进行编码获取评论词所在评论句子的表示向量,以及基于句子级注意力机制对评论句子进行编码获取评论的表示向量
Figure 417743DEST_PATH_IMAGE002
将评论的表示向量
Figure 383425DEST_PATH_IMAGE002
送入预测模型的两个全连接层,分别获取评论的有用性预测概率和评论情感极性预测概率,并基于交叉熵损失函数构建评论有用性概率预测的第一损失函数和评论情感极性概率预测的第二损失函数,再对所述第一损失函数与第二损失函数进行优化。
2.根据权利要求1所述的基于文本和情感极性的评论有用性预测方法,其特征在于,所述基于词级注意力机制对评论词进行编码获取评论词所在评论句子的表示向量,包括:
获取评论句子中词的序列
Figure 502691DEST_PATH_IMAGE003
,其中l∈[1,L],L表示评论中有L条评论句子,T表示评论句子l中词的数量,通过词嵌入矩阵
Figure 630047DEST_PATH_IMAGE004
得到词
Figure 201973DEST_PATH_IMAGE005
的表示向量
Figure 564822DEST_PATH_IMAGE006
,其中m为词典中词的综述,
Figure 538594DEST_PATH_IMAGE007
为表示词向量维度的参数,
Figure 836851DEST_PATH_IMAGE008
Figure 896074DEST_PATH_IMAGE009
,再将评论句子l中的词向量序列
Figure 937979DEST_PATH_IMAGE010
送入第一双向GRU网络中,其中第一时间步的计算如下式(1)、(2)所示,
Figure 766258DEST_PATH_IMAGE011
(1)
Figure 360051DEST_PATH_IMAGE012
(2)
通过式(1)、(2)得到两个隐状态
Figure 906570DEST_PATH_IMAGE013
Figure 17745DEST_PATH_IMAGE014
,再拼接两个隐状态得到第一双向GRU网络的第一时间步的输出
Figure 966109DEST_PATH_IMAGE015
,其中,第一时间步表示评论词;
Figure 848311DEST_PATH_IMAGE016
送入第一多层感知机得到向量
Figure 616547DEST_PATH_IMAGE017
,如下式(3)所示,
Figure 734676DEST_PATH_IMAGE018
(3)
其中,
Figure 537547DEST_PATH_IMAGE019
为可学习的参数,
Figure 473142DEST_PATH_IMAGE020
为待学习的随机初始化的向量参数;
再计算向量
Figure 994253DEST_PATH_IMAGE017
的转置向量
Figure 181652DEST_PATH_IMAGE021
与向量
Figure 839029DEST_PATH_IMAGE022
的内积,再通过softmax函数得到每个第一时间步基于词级注意力机制输出的权重
Figure 820891DEST_PATH_IMAGE023
,如下式(4)所示,
Figure 563720DEST_PATH_IMAGE024
(4)
其中,
Figure 554809DEST_PATH_IMAGE025
为待学习的随机初始化的向量参数;
最后通过加权求和每个第一时间步输出得到句子l的表示向量
Figure 23618DEST_PATH_IMAGE026
,如下式(5)所示,
Figure 707540DEST_PATH_IMAGE027
(5)。
3.根据权利要求2所述的基于文本和情感极性的评论有用性预测方法,其特征在于,所述基于句子级注意力机制对评论句子进行编码获取评论的表示向量,包括:
获取评论中评论句子的表示向量集合
Figure 672085DEST_PATH_IMAGE028
,将向量集合
Figure 325920DEST_PATH_IMAGE029
输入第二双向GRU网络中,其中第二时间步的计算如下式(6)、(7)所示,
Figure 692311DEST_PATH_IMAGE030
(6)
Figure 15976DEST_PATH_IMAGE031
(7)
通过式(6)、(7)得到两个隐状态
Figure 733396DEST_PATH_IMAGE032
Figure 66288DEST_PATH_IMAGE033
,再拼接两个隐状态得到第二双向GRU网络的第二时间步的输出
Figure 552764DEST_PATH_IMAGE034
,其中,第二时间步表示评论句子;
Figure 437544DEST_PATH_IMAGE035
送入第一多层感知机得到向量
Figure 111102DEST_PATH_IMAGE036
,如下式(8)所示,
Figure 982106DEST_PATH_IMAGE037
(8)
其中,
Figure 323088DEST_PATH_IMAGE038
为可学习的参数,
Figure 519714DEST_PATH_IMAGE039
为待学习的随机初始化的向量参数;
再计算向量
Figure 946148DEST_PATH_IMAGE040
的转置向量
Figure 886422DEST_PATH_IMAGE041
与向量
Figure 940966DEST_PATH_IMAGE042
的内积,再通过softmax函数得到每个第二时间步基于句子级注意力机制输出的权重
Figure 42914DEST_PATH_IMAGE043
,如下式(9)所示,
Figure 956643DEST_PATH_IMAGE044
(9)
其中,
Figure 169450DEST_PATH_IMAGE042
为待学习的随机初始化的向量参数;
最后通过加权求和每个第二时间步输出得到评论的表示向量
Figure 344079DEST_PATH_IMAGE002
,如下式(10)所示,
Figure 882508DEST_PATH_IMAGE045
(10)。
4.根据权利要求1所述的基于文本和情感极性的评论有用性预测方法,其特征在于,所述评论的有用性预测概率的获取如下式(11)所示,
Figure 17954DEST_PATH_IMAGE046
(11)
其中,
Figure 768872DEST_PATH_IMAGE047
为评论的有用性预测概率,
Figure 63588DEST_PATH_IMAGE048
为可学习的参数。
5.根据权利要求4所述的基于文本和情感极性的评论有用性预测方法,其特征在于,所述评论情感极性预测概率采用softmax函数获取概率分布,如下式(12)所示,
Figure 241759DEST_PATH_IMAGE049
(12)
其中,
Figure 395660DEST_PATH_IMAGE050
为评论情感极性预测概率,
Figure 950269DEST_PATH_IMAGE051
为可学习的参数。
6.根据权利要求5所述的基于文本和情感极性的评论有用性预测方法,其特征在于,构建评论有用性概率预测的第一损失函数为,采用二元交叉熵损失函数构建第一损失函数
Figure 240436DEST_PATH_IMAGE052
,如下式(13)所示,
Figure 589509DEST_PATH_IMAGE053
(13)
其中,C为训练用评论数据集, C∈(n 1 ,n 2 ,…,n K ),k∈[1,K],
Figure 965127DEST_PATH_IMAGE054
为表示评论有用性的真实标签;
构建评论情感极性概率预测的第二损失函数为,采用多元交叉熵损失函数构建第二损失函数
Figure 448061DEST_PATH_IMAGE055
,如下式(14)所示,
Figure 592734DEST_PATH_IMAGE056
(14)
其中,
Figure 378288DEST_PATH_IMAGE057
为表示评论情感极性的真实标签;
所述对所述第一损失函数与第二损失函数进行优化如下式(15)所示,
Figure 975622DEST_PATH_IMAGE058
(15)
其中,
Figure 872034DEST_PATH_IMAGE059
为所述预测模型的损失函数,θ为可学习的参数。
7.根据权利要求1所述的基于文本和情感极性的评论有用性预测方法,其特征在于,在将评论的表示向量
Figure 995848DEST_PATH_IMAGE002
送入预测模型之前还包括,将所有评论的表示向量基于相似度进行分类,在被分在同一类的评论中选取一条评论,用被选择评论的表示向量代表其所在的评论分类作为输入。
8.根据权利要求7所述的基于文本和情感极性的评论有用性预测方法,其特征在于,所述将所有评论的表示向量基于相似度进行分类包括,预设相似度阈值区间,当两条评论的向量相似度位于所述相似度阈值区间时,两条评论判定为同一分类。
9.一种电子设备,其特征在于,包括:至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至8中任一项所述的基于文本和情感极性的评论有用性预测方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的基于文本和情感极性的评论有用性预测方法。
CN202210000533.4A 2022-01-04 2022-01-04 基于文本和情感极性的评论有用性预测方法、设备及介质 Pending CN114266241A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210000533.4A CN114266241A (zh) 2022-01-04 2022-01-04 基于文本和情感极性的评论有用性预测方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210000533.4A CN114266241A (zh) 2022-01-04 2022-01-04 基于文本和情感极性的评论有用性预测方法、设备及介质

Publications (1)

Publication Number Publication Date
CN114266241A true CN114266241A (zh) 2022-04-01

Family

ID=80832502

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210000533.4A Pending CN114266241A (zh) 2022-01-04 2022-01-04 基于文本和情感极性的评论有用性预测方法、设备及介质

Country Status (1)

Country Link
CN (1) CN114266241A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115168677A (zh) * 2022-06-09 2022-10-11 天翼爱音乐文化科技有限公司 一种评论分类方法、装置、设备及存储介质
CN115329775A (zh) * 2022-10-14 2022-11-11 成都晓多科技有限公司 一种语句中方面类别及情感极性联合识别的方法及系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115168677A (zh) * 2022-06-09 2022-10-11 天翼爱音乐文化科技有限公司 一种评论分类方法、装置、设备及存储介质
CN115329775A (zh) * 2022-10-14 2022-11-11 成都晓多科技有限公司 一种语句中方面类别及情感极性联合识别的方法及系统
CN115329775B (zh) * 2022-10-14 2023-03-24 成都晓多科技有限公司 一种语句中方面类别及情感极性联合识别的方法及系统

Similar Documents

Publication Publication Date Title
Wu et al. A context-aware user-item representation learning for item recommendation
CN114266241A (zh) 基于文本和情感极性的评论有用性预测方法、设备及介质
CN111738807B (zh) 用于推荐目标对象的方法、计算设备和计算机存储介质
Rauf et al. Using bert for checking the polarity of movie reviews
Jahan et al. Sentiment analysis of e-commerce consumer based on product delivery time using machine learning
Chen et al. Question-driven purchasing propensity analysis for recommendation
Zhang et al. Integrating reviews and ratings into graph neural networks for rating prediction
Chatterjee et al. Class-biased sarcasm detection using BiLSTM variational autoencoder-based synthetic oversampling
Purba et al. A hybrid convolutional long short-term memory (CNN-LSTM) based natural language processing (NLP) model for sentiment analysis of customer product reviews in Bangla
Elzeheiry et al. Sentiment analysis for e-commerce product reviews: Current trends and future directions
Zafar Ali Khan et al. Hybrid Collaborative Fusion Based Product Recommendation Exploiting Sentiments from Implicit and Explicit Reviews
Kang et al. Label definitions augmented interaction model for legal charge prediction
Yang et al. An evidence-based multimodal fusion approach for predicting review helpfulness with human-AI complementarity
Ganganwar et al. Employing synthetic data for addressing the class imbalance in aspect-based sentiment classification
Sharma et al. Machine Learning and Sentiment Analysis: Analyzing Customer Feedback
De Oliveira Silveira et al. An Unsupervised Algorithm for Qualitative Coding of Text Data: Artifact Design, Application, and Evaluation
Hariguna et al. Adaptive sentiment analysis using multioutput classification: a performance comparison
Islam et al. Classification of food reviews from bengali text using lstm
Oliveira et al. Sentiment analysis of stock market behavior from Twitter using the R Tool
Almazroi et al. Enhancing aspect-based multi-labeling with ensemble learning for ethical logistics
Rachayya Mathapati Comparative Study Between Deep Learning and Traditional Machine Learning Models for Sentiment Analysis
Deborah et al. Sentiment Analysis and Machine Learning Algorithm Implementation on Flipkart Product Customer Reviews
Kumari et al. Categorization of Youtube videos by using LSTM technique
Shedekar et al. Enhancing E-Commerce Insights: Sentiment Analysis Using Machine Learning and Ensemble Techniques
Bari et al. Analyzing the Performance of Improved Random Forest Based Amazon Product Review Sentiment Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination