CN111666410A - 商品用户评论文本的情感分类方法及系统 - Google Patents

商品用户评论文本的情感分类方法及系统 Download PDF

Info

Publication number
CN111666410A
CN111666410A CN202010473656.0A CN202010473656A CN111666410A CN 111666410 A CN111666410 A CN 111666410A CN 202010473656 A CN202010473656 A CN 202010473656A CN 111666410 A CN111666410 A CN 111666410A
Authority
CN
China
Prior art keywords
commodity
user
text
comment
semantic information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010473656.0A
Other languages
English (en)
Other versions
CN111666410B (zh
Inventor
温家辉
张光达
王之元
王会权
黄安文
何益百
王涛
孙懿淳
张鸿云
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Defense Technology Innovation Institute PLA Academy of Military Science
Original Assignee
National Defense Technology Innovation Institute PLA Academy of Military Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Defense Technology Innovation Institute PLA Academy of Military Science filed Critical National Defense Technology Innovation Institute PLA Academy of Military Science
Priority to CN202010473656.0A priority Critical patent/CN111666410B/zh
Publication of CN111666410A publication Critical patent/CN111666410A/zh
Application granted granted Critical
Publication of CN111666410B publication Critical patent/CN111666410B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • General Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种商品用户评论文本的情感分类方法及系统,该方法包括:获取一个商品用户评论文本,对文本对应用户的行为特征和商品的属性特征间的交互进行建模,获取用户与商品的交互信息;确定评论文本的语义信息;确定商品的其余评论本文对应的其余用户的行为特征,确定用户与其余用户间的行为特征相似性,选择与用户的行为特征相似性最大的若干个用户对应的评论文本作为辅助文本,确定辅助文本的语义信息;获取评论文本的融合语义信息;基于融合语义信息和用户与商品的交互信息,确定评论文本的情感类别。本发明的方法及系统在评论文本的基础上结合用户的行为特征、商品的属性特征和辅助文本,进行评论文本的情感分类,能显著提高分类精度。

Description

商品用户评论文本的情感分类方法及系统
技术领域
本发明涉及互联网信息分类技术领域,尤其涉及一种商品用户评论文本的情感分类方法及系统。
背景技术
随着电商的发展,用户在电商平台上对网购商品进行评价已经成了日常生活的部分。如何对商品用户评论文本进行分析,获得其中的观点倾向和情感极性,是目前人工智能领域的一个重要研究问题。
情感分类一种最常见的文本信息挖掘方法,情感分类是指根据评论文本所表达的含义和情感信息将评论文本划分成褒扬的或贬义的两种或几种类型,是对文本评论作者倾向性和观点态度的划分。情感分类的应用非常广泛,在实际生活中通过分析每条评论文本的情感倾向,能够掌握消费者对产品或服务的满意程度,给商业决策和产品运营带来巨大价值。但网络评论文本,尤其是中文网络评论文本属于非结构化的短文本数据,具有长度不固一定,用词比较随意等特点。因此,为网络评论文本设计合适的情感分类方法仍然是个极具挑战性的任务。
现有的情感分类方法包括有NSC、HCSC、CMA和CTC等,现有的情感分类方法主要利用当前评论文本的语义信息来进行分类,商品的文本信息利用不充分,情感分类的精度具有较大的限制;并且当一个评论文本的情感极性确定性较差时,仅利用评论文本自身的语义信息来进行分类,可能会导致情感分类出现错误,从而降低了分类精度。
发明内容
为解决上述现有技术中存在的技术问题,本发明提供一种商品用户评论文本的情感分类方法及系统。
为此,本发明公开了一种商品用户评论文本的情感分类方法,包括如下内容:
获取一个商品用户评论文本,确定所述文本对应的用户和商品,获取所述文本对应的所述用户的行为特征和所述商品的属性特征,对所述用户的行为特征和所述商品的属性特征之间的交互进行建模,获取用户与商品的交互信息;
根据所述用户的行为特征和所述商品的属性特征,确定所述商品用户评论文本的语义信息;
获取所述商品的其余评论文本,确定所述商品的其余评论本文对应的用户的行为特征,确定所述用户与其余用户间的行为特征相似性,选择所述其余用户中与所述用户的行为特征相似性最大的若干个用户对应的评论文本作为辅助文本,并确定所述辅助文本的语义信息;
将所述商品用户评论文本的语义信息和所述辅助文本的语义信息以设定权重分配方式进行融合处理,获取所述商品用户评论文本的融合语义信息;
基于所述融合语义信息和所述用户与商品的交互信息,确定所述商品用户评论文本的情感类别。
进一步地,在上述商品用户评论文本的情感分类方法中,在确定所述商品用户评论文本对应的用户和商品的基础上,采用嵌入检索操作方法获取所述商品用户评论文本对应的所述用户的行为特征和所述商品的属性特征。
进一步地,在上述商品用户评论文本的情感分类方法中,将所述用户的行为特征和所述商品的属性特征进行拼接处理后输入多层神经网络进行信息处理,以获取用户与商品的交互信息。
进一步地,在上述商品用户评论文本的情感分类方法中,根据所述用户的行为特征和所述商品的属性特征,确定所述商品用户评论文本的语义信息,包括:
运用卷积神经网络对所述商品用户评论文本进行卷积操作,提取所述商品用户评论文本的局部语义信息;
基于所述用户的行为特征和所述商品的属性特征,运用注意力机制对所述商品用户评论文本的局部语义信息进行融合,获取所述商品用户评论文本的语义信息。
进一步地,在上述商品用户评论文本的情感分类方法中,所述辅助文本的语义信息利用下述方式确定:
运用卷积神经网络对所述辅助文本进行卷积操作,提取所述辅助文本的局部语义信息;
基于所述辅助本文对应的用户的行为特征和所述商品的属性特征,运用注意力机制对所述辅助文本的局部语义信息进行融合,获取所述辅助文本的语义信息。
进一步地,在上述商品用户评论文本的情感分类方法中,运用门网络机制对所述商品用户评论文本的语义信息和所述辅助文本的语义信息进行融合处理,获取所述商品用户评论文本的融合语义信息。
进一步地,在上述商品用户评论文本的情感分类方法中,运用单层神经网络对所述融合语义信息和所述用户与商品的交互信息进行信息处理,以计算确定所述商品用户评论文本的情感类别。
此外,本发明还公开了一种商品用户评论文本的情感分类系统,包括:用户商品交互模块、文本编码模块、推测性文本挖掘模块和输出模块;
所述用户商品交互模块用于对用户的行为特征和商品的属性特征之间的交互进行建模,以获取用户与商品的交互信息;
所述文本编码模块用于根据用户的行为特征和商品的属性特征提取商品用户评论文本的语义信息;
所述推测性文本挖掘模块用于根据用户的行为特征提取同一商品的其余评论文本对应的用户中与用户的行为特征相似性最大的若干个用户对应的评论文本,并将提取的若干个评论文本作为辅助文本以协同确定商品用户评论文本的情感类别;
所述输出模块用于对商品用户评论文本的语义信息和辅助文本的语义信息进行融合处理以获取商品用户评论文本的融合语义信息,以及用于对融合语义信息和用户与商品的交互信息进行融合处理以确定商品用户评论文本的情感类别。
本发明技术方案的主要优点如下:
本发明的商品用户评论文本的情感分类方法及系统根据商品用户评论文本确定其对应的用户的行为特征和商品的属性特征,基于用户的行为特征和商品的属性特征从商品的其余评论文本中提取若干个作为辅助文本,在商品用户评论文本的基础上结合用户的行为特征、商品的属性特征和辅助文本,进行商品用户评论文本的情感分类,能够显著提高商品用户评论文本的情感分类精度。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一实施例的商品用户评论文本的情感分类方法的流程图;
图2为本发明一实施例的商品用户评论文本的情感分类系统的结构原理图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以下结合附图,详细说明本发明实施例提供的技术方案。
如附图1所示,本发明一实施例提供了一种商品用户评论文本的情感分类方法,该方法包括如下内容:
获取一个商品用户评论文本,确定文本对应的用户和商品,获取文本对应的用户的行为特征和商品的属性特征,对用户的行为特征和商品的属性特征之间的交互进行建模,获取用户与商品的交互信息;
根据用户的行为特征和商品的属性特征,确定商品用户评论文本的语义信息;
获取商品的其余评论文本,确定商品的其余评论本文对应的用户的行为特征,确定用户与其余用户间的行为特征相似性,选择其余用户中与用户的行为特征相似性最大的若干个用户对应的评论文本作为辅助文本,并确定辅助文本的语义信息;
将商品用户评论文本的语义信息和辅助文本的语义信息以设定权重分配方式进行融合处理,获取商品用户评论文本的融合语义信息;
基于融合语义信息和用户与商品的交互信息,确定商品用户评论文本的情感类别。
以下对本发明一实施例提供的商品用户评论文本的情感分类方法的步骤及原理进行具体说明;
首先,假设:商品用户评论文本的输入形式以一个元祖<ui,pj,dk>表示,ui表示用户,pj表示商品,dk表示用户对商品的评论文本,商品用户评论文本的情感类别的输出结果以一个向量
Figure BDA0002515144140000041
表示。商品用户评论文本的情感类别的数量可以根据实际情况确定,例如可以为5或者10,当情感类别数量为5个时(如第1类表示差评,第5类表示好评,中间类别以此类推),向量
Figure BDA0002515144140000042
为一个维度为5的向量。本发明一实施例中,取向量
Figure BDA0002515144140000043
中数值最大的维度作为对应的情感类别,如一个商品用户评论文本对应的输出向量
Figure BDA0002515144140000044
为(0.1,0.1,0.1,0.1,0.6)时,则该评论文本对应的情感类别为第5类。
基于上述假设,对于一个商品用户评论文本的输入元祖<ui,pj,dk>中的用户ui和商品pj,通过嵌入检索(embedding lookup)操作,分别获取用户的行为特征和商品的属性特征,用户的行为特征以一个隐因子向量ui表示,商品的属性特征以一个隐因子向量pj表示。嵌入检索是一个1对1的映射,将一个用户ui(商品pj)对应唯一一个隐因子向量ui(pj),隐因子向量为模型参数,需要在模型训练中自动学习更新。
本发明一实施例中,通过对用户和商品的交互建模,捕获用户的行为特征(兴趣偏好)和商品的属性特征。由于用户对商品的评论文本的情感极性和用户的兴趣偏好与商品的属性特征之间的匹配程度成正比,即当用户的兴趣偏好和商品的属性特征匹配程度较高时(比如两者的隐因子向量的点积ui Tpj),那么该用户大概率会给该商品好评,反之亦然。传统的协同过滤方法使用用户和商品两者的隐因子向量的点积来对两者的交互进行建模,由于神经网络对任意函数具有良好拟合,本发明一实施例使用神经网络来对用户和商品的交互进行建模。
本发明一实施例中,将用户和商品的隐因子向量进行拼接,输入多层神经网络进行信息处理,以获取用户与商品的交互信息,用户与商品的交互信息以一个输出向量zij表示。
具体地,利用以下公式对用户和商品的隐因子向量进行处理,以获取用户与商品的交互信息;
Figure BDA0002515144140000051
zij=φL(...φ1(z0)...)
φl(zl-1)=σl(Wlzl-1+bl),l=1,2,...,L
其中,[;]表示向量的拼接操作,°为向量的点乘操作,L表示神经网络的层数,φl表示第l层神经网络,σl表示第l层神经网络的激活函数,Wl和bl表示第l层神经网络的参数。
进一步地,由于评论文本的语义信息和评论文本的情感极性具有很大关联性,例如如果评论文本中出现“喜欢”、“质量好”、“服务佳”、“物流快”等词语,那么该评论文本很有可能是好评(情感极性积极);相反,如果评论文本中出现“失望”、“质量差”等词语,那么该评论文本很有可能是差评(情感极性消极);因此,为了实现商品用户评论文本的情感分类,并保证情感分类精度,需要提取评论文本的语义信息,基于提取的评论文本的语义信息对评论文本进行情感分类。本发明一实施例中,运用卷积神经网络和注意力机制对评论文本进行操作处理,以提取评论文本的语义信息。
首先,运用卷积神经网络对商品用户评论文本进行卷积操作,提取商品用户评论文本的局部语义信息。自然语言中一般是若干个毗邻的词才能表达一定的语义信息,比如“质量好”,卷积神经网络中的卷积核能够很好地捕获这些局部语义信息。
假设:一个评论文本dk表示为
Figure BDA0002515144140000052
评论文本的语义信息以一个特征向量dk表示,局部语义信息以一个特征向量ct表示,
Figure BDA0002515144140000053
表示评论文本中的第t个词,lk表示评论文本长度;对于每个词
Figure BDA0002515144140000061
通过嵌入检索操作,获得每个词
Figure BDA0002515144140000062
对应的词向量
Figure BDA0002515144140000063
运用卷积神经网络对词向量进行卷积操作,以提取局部语义信息。
具体地,利用以下公式对评论文本进行卷积操作,以提取局部语义特征;
Figure BDA0002515144140000064
Figure BDA0002515144140000065
其中,Wf和bf为模型参数,Wf也称为卷积核,g为非线性激活函数,*为卷积操作,n为卷积核的个数;对以
Figure BDA0002515144140000066
为中心,个数为s的词向量组成的输入进行卷积操作,输出
Figure BDA0002515144140000067
对应的特征标量ct,f,在卷积神经网络中,一般采取若干个卷积核并行地进行卷积操作,对于
Figure BDA0002515144140000068
每个卷积核将为其产生一个特征标量
Figure BDA0002515144140000069
对这些特征标量进行拼接操作,可以得到
Figure BDA00025151441400000610
所对应的卷积特征向量ct,则评论文本的卷积特征向量可以表示为
Figure BDA00025151441400000611
进一步地,由于自然语言通常由复杂的词法语法结构组成,并不是所有的词语都具有相同的重要性,用户对不同的物品具有不同的关注面,比如一个用户可能会关注一个商品的价格,那么“便宜”、“贵”等类似的词语更能体现该文本的情感极性,对于另外一个商品,用户可能会关注其便携性,那么“方便”、“笨重”等词语能够为情感极性分类提供更好的依据;为此,本发明一实施例中,结合用户的行为特征和商品的属性特征,运用注意力机制对商品用户评论文本的局部语义信息进行融合,获取商品用户评论文本的语义信息,即运用注意力机制对评论文本每个词的卷积特征向量ct进行融合,以获取评论文本的特征向量dk
具体地,利用以下公式对评论文本每个词的卷积特征向量ct进行融合,获取评论文本的特征向量dk
βt=vTtanh(Wcct+Wup[ui;pj]+bd)
Figure BDA00025151441400000612
Figure BDA00025151441400000613
其中,v、Wc、Wup和bd为模型参数,tanh为非线性变换函数,βt表示语义关联度,αt表示归一化的语义关联度;注意力机制的物理意义在于将每个词的卷积特征向量和用户及商品的隐因子向量(即用户的行为特征和商品的属性特征)映射到共同的向量空间,并在词空间比较两者的语义关联度βt,将语义关联度βt归一化得到相应的αt,最后根据αt对卷积特征向量
Figure BDA0002515144140000071
采取加权和操作,得到评论文本的特征向量dk,在加权和过程中,与用户及商品具有更高语义关联度的词将会被赋予更高的权重,达到过滤无用文本信息的效果,从而提取有用的文本信息。
进一步地,本发明一实施例提供的商品用户评论文本的情感分类方法还根据用户的行为特征的相似性,推测性地利用相似的额外文本,以提高评论文本的情感分类的精度。
额外文本指的是当对一个商品用户评论文本进行情感分析时,该商品的其余所有用户评论文本。当对一个商品用户评论文本进行情感分析时,从额外文本中推测性地选取若干与当前评论文本具有相同的情感极性的评论文本作为辅助文本,利用这些辅助文本能够提高当前文本情感分类的精度。比如当一个评论文本的情感极性确定性比较差时,可以通过这些辅助文本提高当前评论文本情感类别的确定性,从而实现文本的正确分类。
具体地,本发明采用下述方式从额外文本中选取辅助文本:
对于一个商品用户评论文本及其对应的用户和商品,将该商品的其余评论文本作为备选的额外文本,根据用户的隐因子向量(行为特征)计算该用户和这些额外文本对应的用户之间的相似性,基于相似性从大到小对额外文本进行排序,选取位于前序的若干个用户对应的评论文本作为辅助文本,即选取相似性最大的若干个用户对应的评论文本作为辅助文本,来协同确定该评论文本的情感极性。
具体地,对于一个输入元祖<ui,pj,dk>,设定商品pj对应的所有额外文本表示为集合D(pj),所有额外文本对应的用户表示为集合U(pj),用户之间相似性的计算以及基于用户相似性的文本融合可以用注意力机制来实现,具体可以利用下述公式计算确定;
Figure BDA0002515144140000072
其中,vssd、Wu、Wp和b为模型参数,tanh为非线性变换函数,s(ui,up)表示用户ui与用户up的相似性,βp表示归一化的相似性程度,dp表示用户up对应的评论文本的特征向量,up表示用户up的隐因子向量,即行为特征,dssd表示辅助文本的特征向量,即辅助文本的语义信息;注意力机制的物理意义在于将用户ui和U(pj)中的每个用户up映射到共同的向量空间,并在此空间衡量两者的相似性s(ui,up),将s(ui,up)进行归一化得到βp,最后根据βp对D(pj)中的文本的特征向量dp进行加权和操作,dp表示用户up对应的评论文本的特征向量,即评论文本的语义信息,和用户ui具有更高相似性的用户对应的评论文本将被赋予更高的权重;其中,用户up对应的评论文本的特征向量dp的确定可以参照上述的商品用户评论文本的特征向量dk的确定方式进行,用户up对应的隐因子向量up的确定可以参照上述的用户ui对应的隐因子向量ui的确定方式进行。
进一步地,当确定当前商品用户评论文本的语义信息(特征向量dk)和辅助文本的语义信息(特征向量dssd)后,利用门网络(gated network)机制对两个特征向量进行融合;具体可以利用下述公式进行融合:
9=σ(Wkdk+Wssddssd+bg)
Figure BDA0002515144140000081
其中,Wk、Wssd和bg为模型参数,°为向量点乘操作,σ为非线性变换函数,d表示商品用户评论文本的融合特征向量,即融合语义信息;门网络机制的物理意义为根据两个不同的输入向量,自动确定它们的权重,再采取加权和的操作对两个输入向量进行融合。
进一步地,当确定商品用户评论文本的融合语义信息后,运用单层神经网络对融合语义信息和用户与商品的交互信息进行处理,以计算确定商品用户评论文本的情感类别;具体可以利用下述公式进行处理:
Figure BDA0002515144140000082
其中,Wd、Wupi和by为模型参数,softmax为归一化指数函数,
Figure BDA0002515144140000083
表示商品用户评论文本的情感类别的输出结果。
进一步地,当训练模型时,本发明根据模型的输出值和真实值之间的差距定义目标函数,目标函数可用如下公式表示:
Figure BDA0002515144140000091
其中,D为训练的数据集,C为评论文本的情感总类别数,C的值因数据集的不同而不同(例如可以为5或者10),
Figure BDA0002515144140000092
表示模型输出结果向量
Figure BDA0002515144140000093
的第c个维度的值,yc表示真实值向量y的第c个维度的值,yc=1表示对应的评论文本的情感类别为c。
具体而言,对于一个输入元组<ui,pj,dk>,以及评论文本dk的情感类别真实值向量y,模型根据上述情感分类方法可输出一个情感类别结果向量
Figure BDA0002515144140000094
定义结果向量
Figure BDA0002515144140000095
和真实值向量y的误差,模型训练过程就是利用梯度下降法最小化结果向量
Figure BDA0002515144140000096
和真实值向量y之间的误差的过程。当利用模型进行评论文本的情感分类时,对于一个输入元组<ui,pj,dk>,根据上述情感分类方法可输出一个情感类别结果向量
Figure BDA0002515144140000097
结果向量
Figure BDA0002515144140000098
中最大值所对应的维度即为输入元组<ui,pj,dk>中评论文本dk所对应的情感类别。
在上述的商品用户评论文本的情感分类方法的基础上,本发明一实施例还提供了一种商品用户评论文本的情感分类系统,该系统包括:用户商品交互模块(user-productinteraction component,UPI)、文本编码模块(document encoding component,DE)、推测性文本挖掘模块(speculative similar document component,SSD)和输出模块;用户商品交互模块用于对用户的行为特征和商品的属性特征之间的交互进行建模,以获取用户与商品的交互信息;文本编码模块用于根据用户的行为特征和商品的属性特征提取商品用户评论文本的语义信息;推测性文本挖掘模块用于根据用户的行为特征提取同一商品的其余评论文本对应的用户中与用户的行为特征相似性最大的若干个用户对应的评论文本,并将提取的若干个评论文本作为辅助文本以协同确定商品用户评论文本的情感类别;输出模块用于对商品用户评论文本的语义信息和辅助文本的语义信息进行融合处理以获取商品用户评论文本的融合语义信息,以及用于对融合语义信息和用户与商品的交互信息进行融合处理以确定商品用户评论文本的情感类别。
本发明一实施例提供的商品用户评论文本的情感分类方法及系统根据商品用户评论文本确定其对应的用户的行为特征和商品的属性特征,基于用户的行为特征和商品的属性特征从商品的其余评论文本中提取若干个作为辅助文本,在商品用户评论文本的基础上结合用户的行为特征、商品的属性特征和辅助文本,进行商品用户评论文本的情感分类,能够显著提高商品用户评论文本的情感分类精度。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。此外,本文中“前”、“后”、“左”、“右”、“上”、“下”均以附图中表示的放置状态为参照。
最后应说明的是:以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种商品用户评论文本的情感分类方法,其特征在于,包括如下内容:
获取一个商品用户评论文本,确定所述文本对应的用户和商品,获取所述文本对应的所述用户的行为特征和所述商品的属性特征,对所述用户的行为特征和所述商品的属性特征之间的交互进行建模,获取用户与商品的交互信息;
根据所述用户的行为特征和所述商品的属性特征,确定所述商品用户评论文本的语义信息;
获取所述商品的其余评论文本,确定所述商品的其余评论本文对应的用户的行为特征,确定所述用户与其余用户间的行为特征相似性,选择所述其余用户中与所述用户的行为特征相似性最大的若干个用户对应的评论文本作为辅助文本,并确定所述辅助文本的语义信息;
将所述商品用户评论文本的语义信息和所述辅助文本的语义信息以设定权重分配方式进行融合处理,获取所述商品用户评论文本的融合语义信息;
基于所述融合语义信息和所述用户与商品的交互信息,确定所述商品用户评论文本的情感类别。
2.根据权利要求1所述的商品用户评论文本的情感分类方法,其特征在于,在确定所述商品用户评论文本对应的用户和商品的基础上,采用嵌入检索操作方法获取所述商品用户评论文本对应的所述用户的行为特征和所述商品的属性特征。
3.根据权利要求2所述的商品用户评论文本的情感分类方法,其特征在于,将所述用户的行为特征和所述商品的属性特征进行拼接处理后输入多层神经网络进行信息处理,以获取用户与商品的交互信息。
4.根据权利要求1或3所述的商品用户评论文本的情感分类方法,其特征在于,根据所述用户的行为特征和所述商品的属性特征,确定所述商品用户评论文本的语义信息,包括:
运用卷积神经网络对所述商品用户评论文本进行卷积操作,提取所述商品用户评论文本的局部语义信息;
基于所述用户的行为特征和所述商品的属性特征,运用注意力机制对所述商品用户评论文本的局部语义信息进行融合,获取所述商品用户评论文本的语义信息。
5.根据权利要求1至4中任一项所述的商品用户评论文本的情感分类方法,其特征在于,所述辅助文本的语义信息利用下述方式确定:
运用卷积神经网络对所述辅助文本进行卷积操作,提取所述辅助文本的局部语义信息;
基于所述辅助本文对应的用户的行为特征和所述商品的属性特征,运用注意力机制对所述辅助文本的局部语义信息进行融合,获取所述辅助文本的语义信息。
6.根据权利要求1至5中任一项所述的商品用户评论文本的情感分类方法,其特征在于,运用门网络机制对所述商品用户评论文本的语义信息和所述辅助文本的语义信息进行融合处理,获取所述商品用户评论文本的融合语义信息。
7.根据权利要求1至6中任一项所述的商品用户评论文本的情感分类方法,其特征在于,运用单层神经网络对所述融合语义信息和所述用户与商品的交互信息进行信息处理,以计算确定所述商品用户评论文本的情感类别。
8.一种商品用户评论文本的情感分类系统,其特征在于,包括:用户商品交互模块、文本编码模块、推测性文本挖掘模块和输出模块;
所述用户商品交互模块用于对用户的行为特征和商品的属性特征之间的交互进行建模,以获取用户与商品的交互信息;
所述文本编码模块用于根据用户的行为特征和商品的属性特征提取商品用户评论文本的语义信息;
所述推测性文本挖掘模块用于根据用户的行为特征提取同一商品的其余评论文本对应的用户中与用户的行为特征相似性最大的若干个用户对应的评论文本,并将提取的若干个评论文本作为辅助文本以协同确定商品用户评论文本的情感类别;
所述输出模块用于对商品用户评论文本的语义信息和辅助文本的语义信息进行融合处理以获取商品用户评论文本的融合语义信息,以及用于对融合语义信息和用户与商品的交互信息进行融合处理以确定商品用户评论文本的情感类别。
CN202010473656.0A 2020-05-29 2020-05-29 商品用户评论文本的情感分类方法及系统 Active CN111666410B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010473656.0A CN111666410B (zh) 2020-05-29 2020-05-29 商品用户评论文本的情感分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010473656.0A CN111666410B (zh) 2020-05-29 2020-05-29 商品用户评论文本的情感分类方法及系统

Publications (2)

Publication Number Publication Date
CN111666410A true CN111666410A (zh) 2020-09-15
CN111666410B CN111666410B (zh) 2022-01-28

Family

ID=72385072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010473656.0A Active CN111666410B (zh) 2020-05-29 2020-05-29 商品用户评论文本的情感分类方法及系统

Country Status (1)

Country Link
CN (1) CN111666410B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113706236A (zh) * 2021-06-02 2021-11-26 联想(北京)有限公司 一种推荐方法、装置及电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160188674A1 (en) * 2014-12-31 2016-06-30 Electronics And Telecommunications Research Institute Emotion-based content recommendation apparatus and method
CN109213860A (zh) * 2018-07-26 2019-01-15 中国科学院自动化研究所 融合用户信息的文本情感分类方法及装置
CN109284506A (zh) * 2018-11-29 2019-01-29 重庆邮电大学 一种基于注意力卷积神经网络的用户评论情感分析系统及方法
CN109461037A (zh) * 2018-12-17 2019-03-12 北京百度网讯科技有限公司 评论观点聚类方法、装置和终端
CN110489553A (zh) * 2019-07-26 2019-11-22 湖南大学 一种基于多源信息融合的情感分类方法
CN110929034A (zh) * 2019-11-26 2020-03-27 北京工商大学 一种基于改进lstm的商品评论细粒度情感分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160188674A1 (en) * 2014-12-31 2016-06-30 Electronics And Telecommunications Research Institute Emotion-based content recommendation apparatus and method
CN109213860A (zh) * 2018-07-26 2019-01-15 中国科学院自动化研究所 融合用户信息的文本情感分类方法及装置
CN109284506A (zh) * 2018-11-29 2019-01-29 重庆邮电大学 一种基于注意力卷积神经网络的用户评论情感分析系统及方法
CN109461037A (zh) * 2018-12-17 2019-03-12 北京百度网讯科技有限公司 评论观点聚类方法、装置和终端
CN110489553A (zh) * 2019-07-26 2019-11-22 湖南大学 一种基于多源信息融合的情感分类方法
CN110929034A (zh) * 2019-11-26 2020-03-27 北京工商大学 一种基于改进lstm的商品评论细粒度情感分类方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113706236A (zh) * 2021-06-02 2021-11-26 联想(北京)有限公司 一种推荐方法、装置及电子设备

Also Published As

Publication number Publication date
CN111666410B (zh) 2022-01-28

Similar Documents

Publication Publication Date Title
Jin et al. Multi-task learning model based on multi-scale CNN and LSTM for sentiment classification
CN108763362B (zh) 基于随机锚点对选择的局部模型加权融合Top-N电影推荐方法
CN111061856B (zh) 一种基于知识感知的新闻推荐方法
Bhuvaneshwari et al. Spam review detection using self attention based CNN and bi-directional LSTM
CN110866542B (zh) 一种基于特征可控融合的深度表示学习方法
CN111222332A (zh) 一种结合注意力网络和用户情感的商品推荐方法
CN111242729A (zh) 一种基于长短期兴趣的序列化推荐方法
CN109492678B (zh) 一种集成浅层和深度学习的App分类方法
CN110929034A (zh) 一种基于改进lstm的商品评论细粒度情感分类方法
CN112749274B (zh) 基于注意力机制和干扰词删除的中文文本分类方法
Duan et al. Semi-supervised learning with generative model for sentiment classification of stock messages
CN112597302B (zh) 基于多维评论表示的虚假评论检测方法
Zhang et al. A multiclassification model of sentiment for E-commerce reviews
CN112256866A (zh) 一种基于深度学习的文本细粒度情感分析方法
Hu et al. Predicting the quality of online health expert question-answering services with temporal features in a deep learning framework
Xiao et al. User preference mining based on fine-grained sentiment analysis
CN112307755A (zh) 基于多特征和深度学习的垃圾评论识别方法
CN114942974A (zh) 电商平台商品用户评价情感倾向分类方法
CN113268592B (zh) 基于多层次交互注意力机制的短文本对象情感分类方法
CN108304568B (zh) 一种房地产公众预期大数据处理方法及系统
CN114048754A (zh) 一种融合上下文信息图卷积的中文短文本分类方法
CN111666410B (zh) 商品用户评论文本的情感分类方法及系统
CN110321565B (zh) 基于深度学习的实时文本情感分析方法、装置及设备
CN114238758B (zh) 一种基于多源跨界数据融合的用户画像预测方法
Elzeheiry et al. Sentiment analysis for e-commerce product reviews: Current trends and future directions

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant