CN110083829A - 情感极性分析方法及相关装置 - Google Patents

情感极性分析方法及相关装置 Download PDF

Info

Publication number
CN110083829A
CN110083829A CN201910267765.4A CN201910267765A CN110083829A CN 110083829 A CN110083829 A CN 110083829A CN 201910267765 A CN201910267765 A CN 201910267765A CN 110083829 A CN110083829 A CN 110083829A
Authority
CN
China
Prior art keywords
term vector
feeling polarities
vocabulary
network model
vector set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910267765.4A
Other languages
English (en)
Inventor
王健宗
贾雪丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910267765.4A priority Critical patent/CN110083829A/zh
Publication of CN110083829A publication Critical patent/CN110083829A/zh
Priority to PCT/CN2019/118447 priority patent/WO2020199600A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种情感极性分析方法及相关装置,应用于电子设备,包括:在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇;将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息;将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签;根据所述输出标签确定所述目标语句段落的情感极性。本发明实施例利于准确迅速地判断出目标语句段落所表达的情感极性。

Description

情感极性分析方法及相关装置
技术领域
本申请涉及电子技术领域,尤其涉及一种情感极性分析方法及相关装置。
背景技术
情感极性分析是一种常见的自然语言处理方法的应用,特别是在以提取文本的情感内容为目标的分类方法中。通过这种方式,情感极性分析可以被视为利用一些情感得分指标来量化定性数据的方法。尽管情绪在很大程度上是主观的,但是情感量化分析已经有很多有用的实践,比如企业分析消费者对产品的反馈信息,或者检测在线评论中的差评信息。
其中,最简单的情感分析方法是利用词语的正负属性来判定。句子中的每个单词都有一个得分,乐观的单词得分为+1,悲观的单词则为-1。然后我们对句子中所有单词得分进行加总求和得到一个最终的情感总分。很明显,这种方法有许多局限之处,最重要的一点在于它忽略了上下文的信息。例如,在这个简易模型中,因为“not”的得分为-1,而“good”的得分为+1,所以词组“not good”将被归类到中性词组中。但是“not good”通常是消极的。另外一个常见的方法是将文本视为一个“词袋”。我们将每个文本看出一个1xN的向量,其中N表示文本词汇的数量。该向量中每一列都是一个单词,其对应的值为该单词出现的频数。例如,词组“bag of bag of words”可以被编码为[2,2,1]。这些数据可以被应用到机器学习分类算法中(比如罗吉斯回归或者支持向量机),从而预测未知数据的情感状况。需要注意的是,这种有监督学习的方法要求利用已知情感状况的数据作为训练集。虽然这个方法改进了之前的模型,但是它仍然忽略了上下文的信息和数据集的规模情况。
发明内容
本申请实施例提供一种情感极性分析方法及相关装置,有利于通过对目标语句段落进行情感极性分析,从而帮助用户迅速的获取目标语句段落所表示的情感极性。
第一方面,本申请实施例提供一种情感极性分析方法,应用于电子设备,所述方法包括:
在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇;
将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息;
将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签;
根据所述输出标签确定所述目标语句段落的情感极性。
第二方面,本申请实施例提供一种情感极性分析装置,应用于电子设备,所述情感极性分析装置包括检测单元、处理单元和确定单元,其中,
所述检测单元,用于在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇;
所述处理单元,用于将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息;
所述处理单元,还用于将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签;
所述确定单元,用于根据所述输出标签确定所述目标语句段落的情感极性。
第三方面,本申请实施例提供一种电子设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面任一方法中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,在本申请实施例中,电子设备首先在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇,其次,将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息,然后,将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签,最后,根据所述输出标签确定所述目标语句段落的情感极性。由于电子设备可以通过在对目标语句段落进行情感极性分析时,先通过第一神经网络模型得到每个语句对应的词向量集合,再通过第二神经网络模型得到每个语句对应的情感极性,在进行情感极性分析是不是单独对一个词汇进行分析,还结合了该词汇对应的上下文,从而有利于提高情感极性分析的准确性,帮助用户迅速得到目标语句段落的情感极性分析结果。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1A是本申请实施例提供的一种情感极性分析方法的流程示意图;
图1B是本申请实施例提供的一种神经网路模型的处理流程示意图;
图2是本申请实施例提供的另一种情感极性分析方法的流程示意图;
图3是本申请实施例提供的另一种情感极性分析方法的流程示意图;
图4是本申请实施例提供的一种电子设备的结构示意图;
图5是本申请实施例提供的一种情感极性分析装置的功能单元组成框图。
具体实现方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
以下分别进行详细说明。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面对本申请实施例进行详细介绍。
请参阅图1A,图1A是本申请实施例提供了一种情感极性分析方法的流程示意图,应用于电子设备,本情感极性分析方法包括:
S101,所述电子设备在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇。
其中,本申请中的情感极性分析方法适用于多种应用场景下,例如,淘宝商品评论情感极性分析,微博评论的情感极性分析,针对企业的意见信的情感极性分析。在检测到用户针对目标语句段落的情感极性分析操作时,获取目标语句段落的多个词汇,目标语句段落可能包含一个语句,也可以包含多个语句,在目标段落包括多个语句时,可先依次确定每个语句对应的情感极性,在确定目标语句段落的情感极性。
S102,所述电子设备将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息。
其中,将目标语句段落中的每个语句进行拆分后,得到多个词汇,将所述多个词汇输入第一神经网络模型得到对应的第一词向量集合,并且,每一个词向量包括对应词汇的上下文信息,例如,当某个语句为“小明同学这次的考试成绩不是很突出”,词汇“突出”对应的情感极性是积极的,但是这句话实际上是消极的,因此,“突出”对应的词向量还包括该词的上下文信息,从而将每个词汇转化为词向量后,有利于更准备的判断每个词汇对应的情感极性。
S103,所述电子设备将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签。
其中,将第一词向量集合中的每个词向量输入第二神经网络模型后,可以得到和第一词向量集合关联的输出标签,该输出标签用于指示目标语句段落代表的情感极性,从而有利于淘宝卖家迅速统计出大量用户评论中的好评数量和差评数量,省去了一个评论一个评论的去阅读理解。
S104,所述电子设备根据所述输出标签确定所述目标语句段落的情感极性。
其中,通过第一神经网络模型得到目标语句段落对应的多个词向量,再通过第二神经网络模型根据多个词向量得到目标语句段落对应的输出标签,根据输出标签可确定目标语句段落的情感极性。由于词向量可用于指示对应词汇的上下文信息,因此通过第一神经网络模型和第二神经网络模型可更准确的确定目标语句段落的情感极性,此外,在使用第一神经网络模型和第二神经网络模型之前,需要先使用大量表示积极情感的语句和大量表示消极情感的语句对第一神经网络模型和第二神经网络模型进行训练,通过对第一神经网络模型和第二神经网络模型中的参数进行调整,使得输入表示积极情感的语句可以输出第一输出标签,输入表示消极情感的语句可以输出第二输出标签。
可以看出,在本申请实施例中,电子设备首先在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇,其次,将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息,然后,将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签,最后,根据所述输出标签确定所述目标语句段落的情感极性。由于电子设备可以通过在对目标语句段落进行情感极性分析时,先通过第一神经网络模型得到每个语句对应的词向量集合,再通过第二神经网络模型得到每个语句对应的情感极性,在进行情感极性分析是不是单独对一个词汇进行分析,还结合了该词汇对应的上下文,从而有利于提高情感极性分析的准确性,帮助用户迅速得到目标语句段落的情感极性分析结果。
在一个可能的示例中,所述将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,包括:获取所述目标段落的多个语句;将所述多个语句中的每个语句进行拆分,并确定拆分后得到的多个词汇的词性;选取词性为预设词性的多个词汇并输入所述第一神经网络模型。
其中,当目标语句段落有多个段落语句时,先确定组成目标语句段落的多语句,再将每个语句进行拆分,拆分后的语句由多个词汇组成,这些词汇中可能包括名词、动词、形容词、副词、介词、代词等词性的词汇,选取拆分后得到的多个词汇中词性为预设词性的词汇。例如,目标段落语句为一个淘宝买家的评价,在获取目标段落语句中的多个词汇,其中词汇可以是两个字的词汇,三个字的词汇等,通过选取预设词性的词汇,可省略其中的连词或者介词,如“的”、“地”以及标点符号,有利于更准确的确定买家的评价是褒义评价还是贬义评价,
可见,本示例中,对拆分后得到的词汇的词性进行判断,从而选取词性为预设词性的多个词汇并输入所述第一神经网络模型,去掉不能判断出情感极性的介词、连词等词汇,或者语句中掺杂的表情符号,特殊字符,有利于简化词汇组成,提高处理效率。
在一个可能的示例中,所述第一神经网络模型为Word2vecc神经网络模型;所述将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,包括:通过对所述多个词汇进行编码将所述多个词汇转换成one-hot向量,所述多个词汇对应的one-hot向量组成第二词向量集合;将所述第二词向量集合中的每个one-hot向量依次输入所述Word2vecc神经网络模型,得到所述第一词向量集合。
其中,Word2vecc是一群用来产生词向量的相关模型,这些模型为浅而双层的神经网络,用来训练以重新构建语言学之词的文本。通过确定一个词的极性,还需确定该词相邻位置的词,在Word2vecc中词袋模型假设下,词的顺序是不重要的。训练完成之后,Word2vecc模型可用来映射每个词到一个向量,可用来表示词对词之间的关系,该向量为神经网络隐藏层。此外,词向量具有良好的语义特性,是表示词语特征的常用方式。词向量每一维的值代表一个具有一定的语义和语法上解释的特征,所以,可以将词向量的每一维称为一个词语特征。词向量具有多种形式,例如one-hot向量,将one-hot向量作为Word2vecc的输入,通过Word2vecc训练低维词向量就可以了。
其中,Word2vec的输入也是词向量,因此,需要先通过编码的方式将多个词汇转换成one-hot向量,从而得到第二词向量集合,将第二词向量集合中的每个词汇对应的one-hot向量依次输入到Word2vec神经网络模型后,得到第一词向量集合,Word2vec是获取第二词向量集合的途径,通过这种途径获得的词向量里面包含了上下文可能的信息,在情感分析中能更准确的识别文本情感。
其中,在Word2vec神经网络模型的输入层,输入的是词向量,例如可以将一个词转化为one-hot向量。在训练Word2vec神经网络模型时,输入是一个one-hot向量,one-hot向量是指用一个向量来表示一个词语,加入在这个语料库中有N个词汇,这个向量的维度是1*N,只有对应位置的元素为1,其他位置的元素都为0。此外,输出的是输入单词的上下文单词的向量,向量里的元素都是在0-1之间,和原本应该出现的one-hot向量取交叉熵作为损失函数,用反向传播的方式训练第一神经网络,以及第一神经网络的权重矩阵。
其中,在训练好第一神经网络模型后,输入一个词汇的one-hot向量,会输出对应词汇的上下文单词概率,同时,第一神经网络模型包含一个隐层的神经网络,训练的是输入权重矩阵,权重矩阵的每一行对应着对应位置的单词的词向量,通多第一神经网络模型得到第一词向量集合后,作为第二神经网络模型的输入。
可见,本示例中,第一神经网络模型可以为Word2vec神经网络模型,在将目标语句段落拆分为多个词汇后,先转化为第二词向量集合,再通过第一神经网络模型得到第一词向量集合,由于第一词向量集合中的词向量里面包含了上下文可能的信息,在情感分析中能更准确地识别目标语句段落所述表达的情感。
在一个可能的示例中,所述第二神经网络模型为SVM神经网络模型。
其中,在第一神经网络模型为Word2vecc神经网络模型时,第二神经网络模型可以是支持向量机(SupportVectorMachine,SVM)模型,SVM模型是用来实现情感分类的,通过Word2vec神经网络模型得到了词向量作为输入,输出是标签,就是指目标语句段落是0或者1,分别代表这目标语句段落的情感极性是积极地还是消极的,SVM的训练集是一段话的词向量表示,通过训练集来训练SVM模型,就可以通过训练后的模型来判断一段话的情感极性,因此,第二神经网络模型可以为SVM模型。
可见,本示例中,在将多个词汇输入Word2vecc神经网络模型之前,需要将词汇转化为one-hot向量,然后通过Word2vecc神经网络模型得到第二词向量集合,第二词向量集合中每个词向量包括对应的上下文信息,将第一词向量集合中的每个词向量输入SVM神经网络模型后通过得到的输出标签可判断情感极性,有利于更准确的推断出目标语句段落的情感极性。
在一个可能的示例中,所述输出标签包括第一标签和第二标签;所述根据所述输出标签确定所述目标语句段落的情感极性,包括:在检测到所述输出标签为所述第一标签时,确定所述目标语句段落对应的情感极性为积极的情感;或者,在检测到所述输出标签为所述第二标签时,确定所述目标语句段落对应的情感极性为消极的情感。
可见,本示例中,将第一词向量集合中的每个词向量输入第二神经网络模型后,得到和第一词向量集合关联的输出标签,通过输出标签,可确定目标语句段落的情感极性。
在一个可能的示例中,所述根据所述输出标签确定所述目标语句段落的情感极性之后,所述方法还包括:在所述目标语句段落的预设显示区域显示所述情感极性。
其中,在得到目标语句段落的情感极性之后,可在目标语句段落的预设显示区域显示得到的情感极性,预设的显示区域可以位于目标语句段落的左侧、右侧、上侧、下侧等位置,或者置顶于目标语句段落的显示区域,可由用户自行进行设定。
可见,本示例中,通过在预设的显示区域显示目标语句段落的情感极性,形成可视化的显示界面,使得用户可快速获取到目标语句段落所表达的情感极性,从而利于淘宝卖家等可以迅速判断出多个用户评价中的好评和差评。
在一个可能的示例中,所述在所述目标语句段落的预设显示区域显示所述情感极性,包括:在检测到所述情感极性为积极的情感时,使用第一颜色进行显示;或者,在检测到所述情感极性为消极的情感时,使用第二颜色进行显示。
其中,通过输出标签,可确定目标语句段落的情感极性是积极地还是消极的,再对不同的情感极性进行差异化显示。例如,当检测出某个评价的情感极性是积极的,即该评价是好评,则用绿色进行显示,当某个评价的情感极性是消极的,即该评价是差评,则用红色进行显示,从而,用户可迅速判断是淘宝评价是好评还是差评。
可见,本示例中,在预设显示区域显示目标语句段落的情感极性时,若在检测到所述情感极性为积极的情感时,使用第一颜色进行显示,在检测到所述情感极性为消极的情感时,使用第二颜色进行显示,所述第一颜色不同于所述第二颜色,通过差异化显示不同的情感极性,有利于用户迅速做出判断。
与所述图1A所示的实施例一致的,请参阅图2,图2是本申请实施例提供的一种情感极性分析方法的流程示意图,应用于电子设备。如图所示,本情感极性分析方法包括:
S201,所述电子设备在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇。
S202,所述电子设备通过对所述多个词汇进行编码将所述多个词汇转换成one-hot向量,所述多个词汇对应的one-hot向量组成第二词向量集合。
S203,所述电子设备将所述第二词向量集合中的每个one-hot向量依次输入所述Word2vecc神经网络模型,得到所述第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息。
S204,所述电子设备将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签。
S205,所述电子设备根据所述输出标签确定所述目标语句段落的情感极性。
可以看出,在本申请实施例中,电子设备首先在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇,其次,将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息,然后,将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签,最后,根据所述输出标签确定所述目标语句段落的情感极性。由于电子设备可以通过在对目标语句段落进行情感极性分析时,先通过第一神经网络模型得到每个语句对应的词向量集合,再通过第二神经网络模型得到每个语句对应的情感极性,在进行情感极性分析是不是单独对一个词汇进行分析,还结合了该词汇对应的上下文,从而有利于提高情感极性分析的准确性,帮助用户迅速得到目标语句段落的情感极性分析结果。
此外,第一神经网络模型可以为Word2vec神经网络模型,在将目标语句段落拆分为多个词汇后,先转化为第二词向量集合,再通过第一神经网络模型得到第一词向量集合,由于第一词向量集合中的词向量里面包含了上下文可能的信息,在情感分析中能更准确地识别目标语句段落所述表达的情感。
与所述图1A、图2所示的实施例一致的,请参阅图3,图3是本申请实施例提供的一种情感极性分析方法的流程示意图,应用于电子设备。如图所示,本情感极性分析方法包括:
S301,所述电子设备在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇。
S302,所述电子设备通过对所述多个词汇进行编码将所述多个词汇转换成one-hot向量,所述多个词汇对应的one-hot向量组成第二词向量集合。
S303,所述电子设备将所述第二词向量集合中的每个one-hot向量依次输入所述Word2vecc神经网络模型,得到所述第一词向量集合,其中,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息。
S304,所述电子设备将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签。
S305,所述电子设备根据所述输出标签确定所述目标语句段落的情感极性。
S306,所述电子设备在所述目标语句段落的预设显示区域显示所述情感极性。
可以看出,在本申请实施例中,电子设备首先在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇,其次,将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息,然后,将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签,最后,根据所述输出标签确定所述目标语句段落的情感极性。由于电子设备可以通过在对目标语句段落进行情感极性分析时,先通过第一神经网络模型得到每个语句对应的词向量集合,再通过第二神经网络模型得到每个语句对应的情感极性,在进行情感极性分析是不是单独对一个词汇进行分析,还结合了该词汇对应的上下文,从而有利于提高情感极性分析的准确性,帮助用户迅速得到目标语句段落的情感极性分析结果。
此外,第一神经网络模型可以为Word2vec神经网络模型,在将目标语句段落拆分为多个词汇后,先转化为第二词向量集合,再通过第一神经网络模型得到第一词向量集合,由于第一词向量集合中的词向量里面包含了上下文可能的信息,在情感分析中能更准确地识别目标语句段落所述表达的情感。
此外,通过在预设的显示区域显示目标语句段落的情感极性,形成可视化的显示界面,使得用户可快速获取到目标语句段落所表达的情感极性,从而利于淘宝卖家等可以迅速判断出多个用户评价中的好评和差评。
与所述图1A、图2、图3所示的实施例一致的,请参阅图4,图4是本申请实施例提供的一种电子设备400的结构示意图,该电子设备400运行有一个或多个应用程序和操作系统,如图所示,该电子设备400包括处理器410、存储器420、通信接口430以及一个或多个程序421,其中,所述一个或多个程序421被存储在所述存储器420中,并且被配置由所述处理器410执行,所述一个或多个程序421包括用于执行以下步骤的指令;
在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇;
将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息;
将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签;
根据所述输出标签确定所述目标语句段落的情感极性。
可以看出,在本申请实施例中,电子设备首先在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇,其次,将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息,然后,将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签,最后,根据所述输出标签确定所述目标语句段落的情感极性。由于电子设备可以通过在对目标语句段落进行情感极性分析时,先通过第一神经网络模型得到每个语句对应的词向量集合,再通过第二神经网络模型得到每个语句对应的情感极性,在进行情感极性分析是不是单独对一个词汇进行分析,还结合了该词汇对应的上下文,从而有利于提高情感极性分析的准确性,帮助用户迅速得到目标语句段落的情感极性分析结果。
在一个可能的示例中,在所述将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合方面,所述程序中的指令具体用于执行以下操作:获取所述目标段落的多个语句;将所述多个语句中的每个语句进行拆分,并确定拆分后得到的多个词汇的词性;选取词性为预设词性的多个词汇并输入所述第一神经网络模型。
在一个可能的示例中,所述第一神经网络模型为Word2vecc神经网络模型;在将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合方面,所述程序中的指令具体用于执行以下操作:通过对所述多个词汇进行编码将所述多个词汇转换成one-hot向量,所述多个词汇对应的one-hot向量组成第二词向量集合;将所述第二词向量集合中的每个one-hot向量依次输入所述Word2vecc神经网络模型,得到所述第一词向量集合。
在一个可能的示例中,所述第二神经网络模型为SVM神经网络模型。
在一个可能的示例中,在所述输出标签包括第一标签和第二标签;所述根据所述输出标签确定所述目标语句段落的情感极性方面,所述程序中的指令具体用于执行以下操作:在检测到所述输出标签为所述第一标签时,确定所述目标语句段落对应的情感极性为积极的情感;或者,在检测到所述输出标签为所述第二标签时,确定所述目标语句段落对应的情感极性为消极的情感。
在一个可能的示例中,所述根据所述输出标签确定所述目标语句段落的情感极性之后,所述程序中的指令具体用于执行以下操作:在所述目标语句段落的预设显示区域显示所述情感极性。
在一个可能的示例中,在所述目标语句段落的预设显示区域显示所述情感极性方面,所述程序中的指令具体用于执行以下操作:在检测到所述情感极性为积极的情感时,使用第一颜色进行显示;或者,在检测到所述情感极性为消极的情感时,使用第二颜色进行显示,所述第一颜色不同于所述第二颜色。
上述实施例主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据所述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
下面为本发明装置实施例,本发明装置实施例用于执行本发明方法实施例所实现的方法。如图5所示的情感极性分析装置500,应用于该电子设备,所述情感极性分析装置包括检测单元501、处理单元502和确定单元503,其中,
所述检测单元501,用于在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇;
所述处理单元502,用于将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息;
所述处理单元502,还用于将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签;
所述确定单元503,用于根据所述输出标签确定所述目标语句段落的情感极性。
可以看出,在本申请实施例中,电子设备首先在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇,其次,将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息,然后,将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签,最后,根据所述输出标签确定所述目标语句段落的情感极性。由于电子设备可以通过在对目标语句段落进行情感极性分析时,先通过第一神经网络模型得到每个语句对应的词向量集合,再通过第二神经网络模型得到每个语句对应的情感极性,在进行情感极性分析是不是单独对一个词汇进行分析,还结合了该词汇对应的上下文,从而有利于提高情感极性分析的准确性,帮助用户迅速得到目标语句段落的情感极性分析结果。
在一个可能的示例中,在所述将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合方面,所述处理单元503还用于:获取所述目标段落的多个语句;以及用于将所述多个语句中的每个语句进行拆分,并确定拆分后得到的多个词汇的词性;以及用于选取词性为预设词性的多个词汇并输入所述第一神经网络模型。
在一个可能的示例中,所述第一神经网络模型为Word2vecc神经网络模型;在所述第一神经网络模型为Word2vecc神经网络模型;所述将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合方面,所述处理单元503具体用于:通过对所述多个词汇进行编码将所述多个词汇转换成one-hot向量,所述多个词汇对应的one-hot向量组成第二词向量集合;以及用于将所述第二词向量集合中的每个one-hot向量依次输入所述Word2vecc神经网络模型,得到所述第一词向量集合。
在一个可能的示例中,所述第二神经网络模型为SVM神经网络模型。在一个可能的示例中,在所述输出标签包括第一标签和第二标签;所述根据所述输出标签确定所述目标语句段落的情感极性方面,所述处理单元503具体用于:在检测到所述输出标签为所述第一标签时,确定所述目标语句段落对应的情感极性为积极的情感;或者,在检测到所述输出标签为所述第二标签时,确定所述目标语句段落对应的情感极性为消极的情感。
在一个可能的示例中,所述根据所述输出标签确定所述目标语句段落的情感极性之后,所述处理单元503具体用于:在所述目标语句段落的预设显示区域显示所述情感极性。
在一个可能的示例中,在所述目标语句段落的预设显示区域显示所述情感极性方面,所述处理单元503具体用于:在检测到所述情感极性为积极的情感时,使用第一颜色进行显示;或者,在检测到所述情感极性为消极的情感时,使用第二颜色进行显示,所述第一颜色不同于所述第二颜色。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种情感极性分析方法,其特征在于,应用于电子设备,所述方法包括:
在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇;
将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息;
将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签;
根据所述输出标签确定所述目标语句段落的情感极性。
2.如权利要求1所述的方法,其特征在于,所述将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,包括:
获取所述目标段落的多个语句;
将所述多个语句中的每个语句进行拆分,并确定拆分后得到的多个词汇的词性;
选取词性为预设词性的多个词汇并输入所述第一神经网络模型。
3.如权利要求1或2所述的方法,其特征在于,所述第一神经网络模型为Word2vecc神经网络模型;所述将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,包括:
通过对所述多个词汇进行编码将所述多个词汇转换成one-hot向量,所述多个词汇对应的one-hot向量组成第二词向量集合;
将所述第二词向量集合中的每个one-hot向量依次输入所述Word2vecc神经网络模型,得到所述第一词向量集合。
4.如权利要求1-3任一项所述的方法,其特征在于,所述第二神经网络模型为SVM神经网络模型。
5.如权利要求1所述的方法,其特征在于,所述输出标签包括第一标签和第二标签;所述根据所述输出标签确定所述目标语句段落的情感极性,包括:
在检测到所述输出标签为所述第一标签时,确定所述目标语句段落对应的情感极性为积极的情感;或者,
在检测到所述输出标签为所述第二标签时,确定所述目标语句段落对应的情感极性为消极的情感。
6.如权利要求1-5任一项所述的方法,其特征在于,所述根据所述输出标签确定所述目标语句段落的情感极性之后,所述方法还包括:
在所述目标语句段落的预设显示区域显示所述情感极性。
7.如权利要求6所述的方法,其特征在于,所述在所述目标语句段落的预设显示区域显示所述情感极性,包括:
在检测到所述情感极性为积极的情感时,使用第一颜色进行显示;或者,
在检测到所述情感极性为消极的情感时,使用第二颜色进行显示,所述第一颜色不同于所述第二颜色。
8.一种情感极性分析装置,其特征在于,应用于电子设备,所述情感极性分析装置包括检测单元、处理单元和确定单元,其中,
所述检测单元,用于在检测到针对目标语句段落的情感极性分析操作时,获取所述目标语句段落的多个词汇;
所述处理单元,用于将所述多个词汇输入第一神经网络模型,得到所述多个词汇对应的第一词向量集合,所述第一词向量集合中的每个词向量用于指示对应词汇的上下文信息;
所述处理单元,还用于将所述第一词向量集合中的每个词向量输入第二神经网络模型,得到和所述第一词向量集合关联的输出标签;
所述确定单元,用于根据所述输出标签确定所述目标语句段落的情感极性。
9.一种服务器,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-7任一项所述的方法。
CN201910267765.4A 2019-04-03 2019-04-03 情感极性分析方法及相关装置 Pending CN110083829A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910267765.4A CN110083829A (zh) 2019-04-03 2019-04-03 情感极性分析方法及相关装置
PCT/CN2019/118447 WO2020199600A1 (zh) 2019-04-03 2019-11-14 情感极性分析方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910267765.4A CN110083829A (zh) 2019-04-03 2019-04-03 情感极性分析方法及相关装置

Publications (1)

Publication Number Publication Date
CN110083829A true CN110083829A (zh) 2019-08-02

Family

ID=67414214

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910267765.4A Pending CN110083829A (zh) 2019-04-03 2019-04-03 情感极性分析方法及相关装置

Country Status (2)

Country Link
CN (1) CN110083829A (zh)
WO (1) WO2020199600A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111666761A (zh) * 2020-05-13 2020-09-15 北京大学 细粒度情感分析模型训练方法及装置
WO2020199600A1 (zh) * 2019-04-03 2020-10-08 平安科技(深圳)有限公司 情感极性分析方法及相关装置
CN111767740A (zh) * 2020-06-23 2020-10-13 北京字节跳动网络技术有限公司 音效添加方法和装置、存储介质和电子设备
WO2021022521A1 (zh) * 2019-08-07 2021-02-11 华为技术有限公司 数据处理的方法、训练神经网络模型的方法及设备
CN112784575A (zh) * 2019-10-22 2021-05-11 北京四维图新科技股份有限公司 语句的处理方法及装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11366965B1 (en) * 2021-10-29 2022-06-21 Jouf University Sentiment analysis using bag-of-phrases for Arabic text dialects
CN116069832B (zh) * 2023-04-07 2023-06-06 微网优联科技(成都)有限公司 数据挖掘方法、装置及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408809A (zh) * 2018-09-25 2019-03-01 天津大学 一种基于词向量的针对汽车产品评论的情感分析方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10181333B2 (en) * 2017-04-04 2019-01-15 International Business Machines Corporation Intelligent truthfulness indicator association
CN108984724B (zh) * 2018-07-10 2021-09-28 凯尔博特信息科技(昆山)有限公司 利用高维表示提高特定属性情感分类准确率方法
CN109213861B (zh) * 2018-08-01 2022-03-29 上海电力学院 结合At_GRU神经网络与情感词典的旅游评价情感分类方法
CN109408823B (zh) * 2018-10-31 2019-08-06 华南师范大学 一种基于多通道模型的特定目标情感分析方法
CN110083829A (zh) * 2019-04-03 2019-08-02 平安科技(深圳)有限公司 情感极性分析方法及相关装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109408809A (zh) * 2018-09-25 2019-03-01 天津大学 一种基于词向量的针对汽车产品评论的情感分析方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020199600A1 (zh) * 2019-04-03 2020-10-08 平安科技(深圳)有限公司 情感极性分析方法及相关装置
WO2021022521A1 (zh) * 2019-08-07 2021-02-11 华为技术有限公司 数据处理的方法、训练神经网络模型的方法及设备
CN112639828A (zh) * 2019-08-07 2021-04-09 华为技术有限公司 数据处理的方法、训练神经网络模型的方法及设备
CN112784575A (zh) * 2019-10-22 2021-05-11 北京四维图新科技股份有限公司 语句的处理方法及装置
CN112784575B (zh) * 2019-10-22 2023-06-30 北京四维图新科技股份有限公司 语句的处理方法及装置
CN111666761A (zh) * 2020-05-13 2020-09-15 北京大学 细粒度情感分析模型训练方法及装置
CN111666761B (zh) * 2020-05-13 2022-12-09 北京大学 细粒度情感分析模型训练方法及装置
CN111767740A (zh) * 2020-06-23 2020-10-13 北京字节跳动网络技术有限公司 音效添加方法和装置、存储介质和电子设备
WO2021259300A1 (zh) * 2020-06-23 2021-12-30 北京字节跳动网络技术有限公司 音效添加方法和装置、存储介质和电子设备

Also Published As

Publication number Publication date
WO2020199600A1 (zh) 2020-10-08

Similar Documents

Publication Publication Date Title
CN110083829A (zh) 情感极性分析方法及相关装置
Matero et al. Suicide risk assessment with multi-level dual-context language and BERT
CN110008311B (zh) 一种基于语义分析的产品信息安全风险监测方法
Shwartz et al. Still a pain in the neck: Evaluating text representations on lexical composition
Meurers et al. Evidence and interpretation in language learning research: Opportunities for collaboration with computational linguistics
Mukhtar et al. Urdu sentiment analysis using supervised machine learning approach
Kumar et al. Get it scored using autosas—an automated system for scoring short answers
CN106815192B (zh) 模型训练方法及装置和语句情感识别方法及装置
CN108363790A (zh) 用于对评论进行评估的方法、装置、设备和存储介质
CN107247702A (zh) 一种文本情感分析处理方法和系统
Krasnowska-Kieraś et al. Empirical linguistic study of sentence embeddings
CN104794212A (zh) 基于用户评论文本的上下文情感分类方法及分类系统
CN112631436B (zh) 输入法敏感词的过滤方法及装置
KR20120109943A (ko) 문장에 내재한 감정 분석을 위한 감정 분류 방법
JP4600045B2 (ja) 意見抽出用学習装置及び意見抽出用分類装置
Alfter Exploring natural language processing for single-word and multi-word lexical complexity from a second language learner perspective
Krommyda et al. Emotion detection in Twitter posts: a rule-based algorithm for annotated data acquisition
Massung et al. Non-native text analysis: A survey
CN114443846A (zh) 一种基于多层级文本异构图的分类方法、装置及电子设备
Kapelner et al. Predicting contextual informativeness for vocabulary learning
Vania On understanding character-level models for representing morphology
Danner et al. Advancing Mental Health Diagnostics: GPT-Based Method for Depression Detection
Nama et al. Sentiment analysis of movie reviews: A comparative study between the naive-bayes classifier and a rule-based approach
JP2658997B2 (ja) キーワード利用による文意評価装置
Mollet et al. Choosing the best tools for comparative analyses of texts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination