CN113536773A - 商品评论情感分析方法、系统、电子设备及存储介质 - Google Patents

商品评论情感分析方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN113536773A
CN113536773A CN202110821905.5A CN202110821905A CN113536773A CN 113536773 A CN113536773 A CN 113536773A CN 202110821905 A CN202110821905 A CN 202110821905A CN 113536773 A CN113536773 A CN 113536773A
Authority
CN
China
Prior art keywords
comment
attention
word
syntactic
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110821905.5A
Other languages
English (en)
Inventor
王硕
杨康
王同乐
李霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mininglamp Software System Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN202110821905.5A priority Critical patent/CN113536773A/zh
Publication of CN113536773A publication Critical patent/CN113536773A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明提出一种商品评论情感分析方法、系统、电子设备及存储介质,其方法技术方案包括词嵌入表示获取步骤,获取一商品的评论及所述评论的评价对象,将所述评论和所述评价对象输入至一预训练语言模型中获取所述评论每个词的词嵌入表示;词句注意力计算步骤,根据所述词嵌入表示计算所述评论的句法注意力,并进一步根据所述词嵌入表示计算所述评论中的词性注意力;交互注意力计算步骤,将所述句法注意力和所述词性注意力与所述词嵌入表示进行交互注意力的计算;情感极性获取步骤,将所述交互注意力输入至全连接层,进行softmax处理后获取所述评论在当前所述评价对象下的情感极性。本申请解决了现有商品评论情感分析方法智能化程度低的问题。

Description

商品评论情感分析方法、系统、电子设备及存储介质
技术领域
本发明属于自然语言处理技术领域,尤其涉及一种商品评论情感分析方法、系统、电子设备及存储介质。
背景技术
商品评论是商家获取消费者对于商品反馈的重要途径,理解消费者在商品评论中表达的情感被称为情感分析。目前,基于商品评论的情感分析分为句子级和评价对象级,其中评价对象级指得是获取针对消费者提出的某个具体的商品某种属性或特征的情感极性,这种级别的情感分析对于商业决策时非常宝贵的信息。但是商品评论受到消费者语言习惯的影响往往不是结构化的文本,并且其信息的实时性、数据的巨大性导致了很难通过人工方法去快速的进行情感分析,因此基于评价对象的商品评论情感分析技术吸引了国内外众多研究这的目光,已成为当前研究的热点内容。
发明内容
本申请实施例提供了一种商品评论情感分析方法、系统、电子设备及存储介质,以至少解决现有商品评论情感分析方法智能化程度低的问题。
第一方面,本申请实施例提供了一种商品评论情感分析方法,包括:词嵌入表示获取步骤,获取一商品的评论及所述评论的评价对象,将所述评论和所述评价对象输入至一预训练语言模型中获取所述评论每个词的词嵌入表示;词句注意力计算步骤,根据所述词嵌入表示计算所述评论的句法注意力,并进一步根据所述词嵌入表示计算所述评论中的词性注意力;交互注意力计算步骤,将所述句法注意力和所述词性注意力与所述词嵌入表示进行交互注意力的计算;情感极性获取步骤,将所述交互注意力输入至全连接层,进行softmax处理后获取所述评论在当前所述评价对象下的情感极性。
优选的,所述词嵌入表示获取步骤进一步包括:将所述评论和所述评价对象输入至共享参数的RoBERTa中获取所述词嵌入表示。
优选的,所述词句注意力计算步骤进一步包括:通过通用的中文情感分析语料,训练出第k种句法依赖关系在通用的中文情感分析情境下的权重Vk,将所述评论通过一句法解析工具转换成句法依赖树,计算得到所述评论中第i个单词对于第j个单词的所述句法注意力
Figure BDA0003170567260000021
其中i→j表示在所述句法依赖树中所述第i个单词到所述第j个单词所经过的句法依赖关系路径。
优选的,所述词句注意力计算步骤进一步包括:根据所述评论获取句法注意力矩阵,并将所述词嵌入表示与所述句法注意力矩阵相乘,获取到第二词嵌入表示,并进一步训练出所述评论中每种词性对应的词性向量,根据所述第二词嵌入表示和所述词性向量计算得到所述词性注意力。
第二方面,本申请实施例提供了一种商品评论情感分析系统,适用于上述一种商品评论情感分析方法,包括:词嵌入表示获取模块,获取一商品的评论及所述评论的评价对象,将所述评论和所述评价对象输入至一预训练语言模型中获取所述评论每个词的词嵌入表示;词句注意力计算模块,根据所述词嵌入表示计算所述评论的句法注意力,并进一步根据所述词嵌入表示计算所述评论中的词性注意力;交互注意力计算模块,将所述句法注意力和所述词性注意力与所述词嵌入表示进行交互注意力的计算;情感极性获取模块,将所述交互注意力输入至全连接层,进行softmax处理后获取所述评论在当前所述评价对象下的情感极性。
在其中一些实施例中,所述词嵌入表示获取模块进一步包括:将所述评论和所述评价对象输入至共享参数的RoBERTa中获取所述词嵌入表示。
在其中一些实施例中,所述词句注意力计算模块进一步包括:通过通用的中文情感分析语料,训练出第k种句法依赖关系在通用的中文情感分析情境下的权重Vk,将所述评论通过一句法解析工具转换成句法依赖树,计算得到所述评论中第i个单词对于第j个单词的所述句法注意力
Figure BDA0003170567260000022
其中i→j表示在所述句法依赖树中所述第i个单词到所述第j个单词所经过的句法依赖关系路径。
在其中一些实施例中,所述词句注意力计算模块进一步包括:根据所述评论获取句法注意力矩阵,并将所述词嵌入表示与所述句法注意力矩阵相乘,获取到第二词嵌入表示,并进一步训练出所述评论中每种词性对应的词性向量,根据所述第二词嵌入表示和所述词性向量计算得到所述词性注意力。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的一种商品评论情感分析方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的一种商品评论情感分析方法。
本申请可应用于营销智能技术领域。相比于相关技术,本申请实施例提供的一种商品评论情感分析方法,给定一条完整的商品评论及评论中特定的评价对象作为模型的输入,目的是获取基于当前特定评价对象下该条评论的情感极性(积极、中性、消极)。为了获取单词信息更加丰富的词向量嵌入表示,使用RoBERTa作为模型的词嵌入工具,其次,考虑到句法依赖结构和单词词性可以有效的提高情感分析的准确性,设计句法注意力模块和词性注意力模块提取评论中更富含情感极性的信息,再通过文本表示和评价对象表示之间的交互注意力降低无关词语的影响,最终通过全连接层获取情感极性。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本发明的商品评论情感分析方法流程图;
图2为本发明的商品评论情感分析系统的框架图;
图3为本发明的电子设备的框架图;
以上图中:
1、词嵌入表示获取模块;2、词句注意力计算模块;3、交互注意力计算模块;4、情感极性获取模块;60、总线;61、处理器;62、存储器;63、通信接口。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
以下,结合附图详细介绍本发明的实施例:
图1为本发明的商品评论情感分析方法流程图,请参见图1,本发明商品评论情感分析方法包括如下步骤:
S1:获取一商品的评论及所述评论的评价对象,将所述评论和所述评价对象输入至一预训练语言模型中获取所述评论每个词的词嵌入表示。
可选的,预训练语言模型可为RoBERTa,将所述评论和所述评价对象输入至共享参数的RoBERTa中获取所述词嵌入表示。
在具体实施中,将完整的商品评论和具体的评价对象同时输入到共享参数的RoBERTa中获取每个单词的词嵌入表示,因为RoBERTa是一个大规模的预训练语言模型,所以该步骤中获取的词嵌入表示含有更加丰富的语义信息。
S2:根据所述词嵌入表示计算所述评论的句法注意力,并进一步根据所述词嵌入表示计算所述评论中的词性注意力。
可选的,通过通用的中文情感分析语料,训练出第k种句法依赖关系在通用的中文情感分析情境下的权重Vk,将所述评论通过一句法解析工具转换成句法依赖树,计算得到所述评论中第i个单词对于第j个单词的所述句法注意力
Figure BDA0003170567260000051
其中i→j表示在所述句法依赖树中所述第i个单词到所述第j个单词所经过的句法依赖关系路径。
可选的,根据所述评论获取句法注意力矩阵,并将所述词嵌入表示与所述句法注意力矩阵相乘,获取到第二词嵌入表示,并进一步训练出所述评论中每种词性对应的词性向量,根据所述第二词嵌入表示和所述词性向量计算得到所述词性注意力。
在具体实施中,将完整商品评论的词嵌入表示进行句法注意力计算。已知将句子通过句法依赖解析可以分解为一颗完整的句法依赖树,句法依赖树中节点间的连线表示了不同的句法依赖关系。不同的句法依赖关系对于情感分析的帮助权重不同。首先通过通用的中文情感分析语料,训练出第k种句法依赖关系在通用情感分析情境下的权重Vk。将当前完整商品评论通过句法解析工具转换成句法依赖树,句子中第i个单词对于第j个单词的句法注意力可以表示为
Figure BDA0003170567260000061
其中i→j表示在句法依赖树中单词i到单词j所经过的句法依赖关系路径。对于长度为n的商品评论,可以获取到规模为n*n的句法注意力矩阵,将词嵌入表示与句法注意力矩阵进行矩阵相乘,获取到新的词嵌入表示,即第二词嵌入表示。
在具体实施中,将获取到的第二词嵌入表示进行词性注意力计算。首先在当前的商品评论语料上对于每种词性训练出对应的词性向量,将第二词嵌入表示与词性向量进行注意力计算,可以有效的考虑到不同词性对于情感分析结果的影响。
S3:将所述句法注意力和所述词性注意力与所述词嵌入表示进行交互注意力的计算。
在具体实施中,通过已获取到的单词结合了句法关系和词性关系的句法注意力和词性注意力,将其与步骤S1中获取的评价对象词嵌入表示进行交互注意力的计算。可以计算出在当前评价对象下,情感极性更应该关注句子中的那些部分。
S4:将所述交互注意力输入至全连接层,进行softmax处理后获取所述评论在当前所述评价对象下的情感极性。
在具体实施中,将步骤S3获取到的结果输入到全连接层,进行softmax处理后获取完整商品评论在当前评价对象下的情感极性。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例提供了一种商品评论情感分析系统,适用于上述的一种商品评论情感分析方法。如以下所使用的,术语“单元”、“模块”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件、或者软件和硬件的组合的实现也是可能并被构想的。
图2为根据本发明的商品评论情感分析系统的框架图,请参见图2,包括:
词嵌入表示获取模块1:获取一商品的评论及所述评论的评价对象,将所述评论和所述评价对象输入至一预训练语言模型中获取所述评论每个词的词嵌入表示。
可选的,预训练语言模型可为RoBERTa,将所述评论和所述评价对象输入至共享参数的RoBERTa中获取所述词嵌入表示。
在具体实施中,将完整的商品评论和具体的评价对象同时输入到共享参数的RoBERTa中获取每个单词的词嵌入表示,因为RoBERTa是一个大规模的预训练语言模型,所以该模块中获取的词嵌入表示含有更加丰富的语义信息。
词句注意力计算模块2:根据所述词嵌入表示计算所述评论的句法注意力,并进一步根据所述词嵌入表示计算所述评论中的词性注意力。
可选的,通过通用的中文情感分析语料,训练出第k种句法依赖关系在通用的中文情感分析情境下的权重Vk,将所述评论通过一句法解析工具转换成句法依赖树,计算得到所述评论中第i个单词对于第j个单词的所述句法注意力
Figure BDA0003170567260000071
其中i→j表示在所述句法依赖树中所述第i个单词到所述第j个单词所经过的句法依赖关系路径。
可选的,根据所述评论获取句法注意力矩阵,并将所述词嵌入表示与所述句法注意力矩阵相乘,获取到第二词嵌入表示,并进一步训练出所述评论中每种词性对应的词性向量,根据所述第二词嵌入表示和所述词性向量计算得到所述词性注意力。
在具体实施中,将完整商品评论的词嵌入表示进行句法注意力计算。已知将句子通过句法依赖解析可以分解为一颗完整的句法依赖树,句法依赖树中节点间的连线表示了不同的句法依赖关系。不同的句法依赖关系对于情感分析的帮助权重不同。首先通过通用的中文情感分析语料,训练出第k种句法依赖关系在通用情感分析情境下的权重Vk。将当前完整商品评论通过句法解析工具转换成句法依赖树,句子中第i个单词对于第j个单词的句法注意力可以表示为
Figure BDA0003170567260000081
其中i→j表示在句法依赖树中单词i到单词j所经过的句法依赖关系路径。对于长度为n的商品评论,可以获取到规模为n*n的句法注意力矩阵,将词嵌入表示与句法注意力矩阵进行矩阵相乘,获取到新的词嵌入表示,即第二词嵌入表示。
在具体实施中,将获取到的第二词嵌入表示进行词性注意力计算。首先在当前的商品评论语料上对于每种词性训练出对应的词性向量,将第二词嵌入表示与词性向量进行注意力计算,可以有效的考虑到不同词性对于情感分析结果的影响。
交互注意力计算模块3:将所述句法注意力和所述词性注意力与所述词嵌入表示进行交互注意力的计算。
在具体实施中,通过已获取到的单词结合了句法关系和词性关系的句法注意力和词性注意力,将其与词嵌入表示获取模块1中获取的评价对象词嵌入表示进行交互注意力的计算。可以计算出在当前评价对象下,情感极性更应该关注句子中的那些部分。
情感极性获取模块4:将所述交互注意力输入至全连接层,进行softmax处理后获取所述评论在当前所述评价对象下的情感极性。
在具体实施中,将交互注意力计算模块3获取到的结果输入到全连接层,进行softmax处理后获取完整商品评论在当前评价对象下的情感极性。
另外,结合图1描述的一种商品评论情感分析方法可以由电子设备来实现。图3为本发明的电子设备的框架图。
电子设备可以包括处理器61以及存储有计算机程序指令的存储器62。
具体地,上述处理器61可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
其中,存储器62可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器62可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器62可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器62可在数据处理装置的内部或外部。在特定实施例中,存储器62是非易失性(Non-Volatile)存储器。在特定实施例中,存储器62包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(RandomAccess Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器62可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器61所执行的可能的计算机程序指令。
处理器61通过读取并执行存储器62中存储的计算机程序指令,以实现上述实施例中的任意一种商品评论情感分析方法。
在其中一些实施例中,电子设备还可包括通信接口63和总线60。其中,如图3所示,处理器61、存储器62、通信接口63通过总线60连接并完成相互间的通信。
通信端口63可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线60包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。总线60包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(ControlBus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线60可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(FrontSide Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线60可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该电子设备可以执行本申请实施例中的一种商品评论情感分析方法。
另外,结合上述实施例中的一种商品评论情感分析方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种商品评论情感分析方法。
而前述的存储介质包括:U盘、移动硬盘、只读存储器(ReadOnly Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种商品评论情感分析方法,其特征在于,包括:
词嵌入表示获取步骤,获取一商品的评论及所述评论的评价对象,将所述评论和所述评价对象输入至一预训练语言模型中获取所述评论每个词的词嵌入表示;
词句注意力计算步骤,根据所述词嵌入表示计算所述评论的句法注意力,并进一步根据所述词嵌入表示计算所述评论中的词性注意力;
交互注意力计算步骤,将所述句法注意力和所述词性注意力与所述词嵌入表示进行交互注意力的计算;
情感极性获取步骤,将所述交互注意力输入至全连接层,进行softmax处理后获取所述评论在当前所述评价对象下的情感极性。
2.根据权利要求1所述的商品评论情感分析方法,其特征在于,所述词嵌入表示获取步骤进一步包括:将所述评论和所述评价对象输入至共享参数的RoBERTa中获取所述词嵌入表示。
3.根据权利要求1所述的商品评论情感分析方法,其特征在于,所述词句注意力计算步骤进一步包括:
通过通用的中文情感分析语料,训练出第k种句法依赖关系在通用的中文情感分析情境下的权重Vk,将所述评论通过一句法解析工具转换成句法依赖树,计算得到所述评论中第i个单词对于第j个单词的所述句法注意力
Figure FDA0003170567250000011
其中i→j表示在所述句法依赖树中所述第i个单词到所述第j个单词所经过的句法依赖关系路径。
4.根据权利要求3所述的商品评论情感分析方法,其特征在于,所述词句注意力计算步骤进一步包括:
根据所述评论获取句法注意力矩阵,并将所述词嵌入表示与所述句法注意力矩阵相乘,获取到第二词嵌入表示,并进一步训练出所述评论中每种词性对应的词性向量,根据所述第二词嵌入表示和所述词性向量计算得到所述词性注意力。
5.一种商品评论情感分析系统,其特征在于,包括:
词嵌入表示获取模块,获取一商品的评论及所述评论的评价对象,将所述评论和所述评价对象输入至一预训练语言模型中获取所述评论每个词的词嵌入表示;
词句注意力计算模块,根据所述词嵌入表示计算所述评论的句法注意力,并进一步根据所述词嵌入表示计算所述评论中的词性注意力;
交互注意力计算模块,将所述句法注意力和所述词性注意力与所述词嵌入表示进行交互注意力的计算;
情感极性获取模块,将所述交互注意力输入至全连接层,进行softmax处理后获取所述评论在当前所述评价对象下的情感极性。
6.根据权利要求5所述的商品评论情感分析系统,其特征在于,所述词嵌入表示获取模块进一步包括:将所述评论和所述评价对象输入至共享参数的RoBERTa中获取所述词嵌入表示。
7.根据权利要求5所述的商品评论情感分析系统,其特征在于,所述词句注意力计算模块进一步包括:
通过通用的中文情感分析语料,训练出第k种句法依赖关系在通用的中文情感分析情境下的权重Vk,将所述评论通过一句法解析工具转换成句法依赖树,计算得到所述评论中第i个单词对于第j个单词的所述句法注意力
Figure FDA0003170567250000021
其中i→j表示在所述句法依赖树中所述第i个单词到所述第j个单词所经过的句法依赖关系路径。
8.根据权利要求7所述的商品评论情感分析系统,其特征在于,所述词句注意力计算模块进一步包括:
根据所述评论获取句法注意力矩阵,并将所述词嵌入表示与所述句法注意力矩阵相乘,获取到第二词嵌入表示,并进一步训练出所述评论中每种词性对应的词性向量,根据所述第二词嵌入表示和所述词性向量计算得到所述词性注意力。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的商品评论情感分析方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至4中任一项所述的商品评论情感分析方法。
CN202110821905.5A 2021-07-20 2021-07-20 商品评论情感分析方法、系统、电子设备及存储介质 Pending CN113536773A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110821905.5A CN113536773A (zh) 2021-07-20 2021-07-20 商品评论情感分析方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110821905.5A CN113536773A (zh) 2021-07-20 2021-07-20 商品评论情感分析方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113536773A true CN113536773A (zh) 2021-10-22

Family

ID=78100599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110821905.5A Pending CN113536773A (zh) 2021-07-20 2021-07-20 商品评论情感分析方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113536773A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114048288A (zh) * 2021-11-10 2022-02-15 北京明略软件系统有限公司 细粒度情感分析方法、系统、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170681A (zh) * 2018-01-15 2018-06-15 中南大学 文本情感分析方法、系统及计算机可读存储介质
CN109885670A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种面向话题文本的交互注意力编码情感分析方法
CN111488734A (zh) * 2020-04-14 2020-08-04 西安交通大学 基于全局交互和句法依赖的情感特征表示学习系统及方法
CN111881291A (zh) * 2020-06-19 2020-11-03 山东师范大学 一种文本情感分类方法及系统
US20210089936A1 (en) * 2019-09-24 2021-03-25 International Business Machines Corporation Opinion snippet detection for aspect-based sentiment analysis

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108170681A (zh) * 2018-01-15 2018-06-15 中南大学 文本情感分析方法、系统及计算机可读存储介质
CN109885670A (zh) * 2019-02-13 2019-06-14 北京航空航天大学 一种面向话题文本的交互注意力编码情感分析方法
US20210089936A1 (en) * 2019-09-24 2021-03-25 International Business Machines Corporation Opinion snippet detection for aspect-based sentiment analysis
CN111488734A (zh) * 2020-04-14 2020-08-04 西安交通大学 基于全局交互和句法依赖的情感特征表示学习系统及方法
CN111881291A (zh) * 2020-06-19 2020-11-03 山东师范大学 一种文本情感分类方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
韩虎,刘国利: "用于特定目标情感分析的交互注意力网络模型", 计算机工程与应用, vol. 56, no. 18, 30 September 2020 (2020-09-30), pages 104 - 110 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114048288A (zh) * 2021-11-10 2022-02-15 北京明略软件系统有限公司 细粒度情感分析方法、系统、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN110209805B (zh) 文本分类方法、装置、存储介质和计算机设备
CN109344406B (zh) 词性标注方法、装置和电子设备
CN105389307A (zh) 语句意图类别识别方法及装置
US20170060826A1 (en) Automatic Sentence And Clause Level Topic Extraction And Text Summarization
CN111159412B (zh) 分类方法、装置、电子设备及可读存储介质
CN108959413B (zh) 一种主题网页爬取方法及主题爬虫系统
US20170039185A1 (en) Method and system for applying role based association to entities in textual documents
US9672475B2 (en) Automated opinion prediction based on indirect information
US11157540B2 (en) Search space reduction for knowledge graph querying and interactions
Kumar et al. Analysis of users’ sentiments from kannada web documents
CN112199473A (zh) 一种知识问答系统中的多轮对话方法与装置
CN110019820B (zh) 一种病历中主诉与现病史症状时间一致性检测方法
CN111241843B (zh) 基于复合神经网络的语义关系推断系统和方法
CN113535912B (zh) 基于图卷积网络和注意力机制的文本关联方法及相关设备
CN113536773A (zh) 商品评论情感分析方法、系统、电子设备及存储介质
CN114048288A (zh) 细粒度情感分析方法、系统、计算机设备和存储介质
CN116561320A (zh) 一种汽车评论的分类方法、装置、设备及介质
Rachman et al. Rhetorical sentence categorization for scientific paper using word2Vec semantic representation
CN113139383A (zh) 一种文档排序方法、系统、电子设备及存储介质
CN113641789A (zh) 基于分层融合多头注意力网络和卷积网络的观点检索方法及系统
Gayen et al. Automatic identification of Bengali noun-noun compounds using random forest
CN112035622A (zh) 一种自然语言处理的集成平台及方法
CN117909505B (zh) 事件论元的抽取方法及相关设备
CN111814025A (zh) 一种观点提取方法及装置
CN110929513A (zh) 基于文本的标签体系构建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination