CN113609865A - 文本情感的识别方法、装置、电子设备及可读存储介质 - Google Patents

文本情感的识别方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN113609865A
CN113609865A CN202110907972.9A CN202110907972A CN113609865A CN 113609865 A CN113609865 A CN 113609865A CN 202110907972 A CN202110907972 A CN 202110907972A CN 113609865 A CN113609865 A CN 113609865A
Authority
CN
China
Prior art keywords
expression
text
processed
emotion
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110907972.9A
Other languages
English (en)
Inventor
李犇
张�杰
吴信东
吴明辉
于皓
袁杰
陈栋
邓礼志
罗华刚
王展
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miaozhen Information Technology Co Ltd
Original Assignee
Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Minglue Artificial Intelligence Group Co Ltd filed Critical Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority to CN202110907972.9A priority Critical patent/CN113609865A/zh
Publication of CN113609865A publication Critical patent/CN113609865A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本申请提供了一种文本情感的识别方法、装置、电子设备及可读存储介质,从待识别文本中识别出待处理表情符号和待处理文字文本;分别将每个待处理表情符号转换为表情编码,以及将每个待处理文字文本转换为文字编码;将每个文字编码和每个表情编码输入至情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量和每个待处理表情符号的表情编码向量;拼接每个文字编码向量以及每个表情编码向量,得到待识别文本的文本特征向量;将文本特征向量输入至情感类别识别模型中的情感分类层,确定待识别文本的情感类别。这样,便可以更加准确地确定出待识别文本的情感类别,有助于提高识别结果的准确性。

Description

文本情感的识别方法、装置、电子设备及可读存储介质
技术领域
本申请涉及语言处理技术领域,尤其是涉及一种文本情感的识别方法、装置、电子设备及可读存储介质。
背景技术
随着互联网技术的发展,人们越来越习惯于在各种社交媒体平台、电子商务平台以及点评分享平台上分享自己的使用产品的感受和经验,这些都被称用户生成内容(UGC),品牌运行商为了更好的进行用户洞察分析,通过采集用户生成内容,年轻的用户为了能更好表达自己的感受和情感,往往会使用很多emoji符号,这些emoji符号在很多情况下是被过滤掉了,因此,在很多情况下是无法准确地对用户的情感进行揣测的。因此,如何准确的识别存在表情符号的情感类别成为了亟待解决的问题。
发明内容
有鉴于此,本申请的目的在于提供一种文本情感的识别方法、装置、电子设备及可读存储介质,可以结合待识别文本中的标签符号,对待识别文本的情感类别进行识别,从而,可以更加准确地确定出待识别文本的情感类别,有助于提高识别结果的准确性。
本申请实施例提供了一种文本情感的识别方法,所述识别方法包括:
从获取到的待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本;
针对于每个待处理表情符号和每个待处理文字文本,分别将该待处理表情符号转换为表情编码,以及将该待处理文字文本转换为文字编码;
将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量;
通过所述情感类别识别模型的向量拼接层,拼接每个文字编码向量以及每个表情编码向量,得到所述待识别文本的文本特征向量;
将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别。
进一步的,所述将每个文字编码和每个表情编码输入至情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量,包括:
将每个待处理文字文本的文字编码输入至向量编码层中的文字编码子层,得到每个待处理文字文本的文字编码向量;
将每个待处理表情符号的表情编码输入至向量编码层中的表情编码子层,得到每个待处理表情符号的表情编码向量。
进一步的,所述将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别,包括:
将所述文本特征向量输入至所述情感分类层中的概率预测子层,确定所述待识别文本为每种情感类别的类别概率;
基于所述待识别文本为每种情感类别的类别概率,通过所述情感分类层中的类别确定子层,将类别概率最大的情感类别确定为所述待识别文本的情感类别。
进一步的,通过以下步骤将每个待处理表情符号转换为表情编码:
针对于每个待处理表情符号,从该待处理表情符号中提取出用于表征该待处理表情符号的表情图像特征;
基于该待处理表情符号的表情图像特征,确定该待处理表情符号所属的表情类别组;
将所述表情类别组的表情编码确定为该待处理表情符号的表情编码。
进一步的,所述识别方法还包括:
获取多个样本语言文本;
从所述多个样本语言文本中提取出来源不同的多个样本表情符号;
针对于每个样本表情符号,从该表情符号中提取出用于表征该样本表情符号的表情图像特征;
基于每个样本表情符号的表情图像特征,对所述多个样本表情符号进行聚类处理,确定出多个表情类别组;
针对于每个表情类别组,为该表情类别组分配统一的表情编码。
本申请实施例还提供了一种文本情感的识别装置,所述识别装置包括:
识别模块,用于从获取到的待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本;
编码模块,用于针对于每个待处理表情符号和每个待处理文字文本,分别将该待处理表情符号转换为表情编码,以及将该待处理文字文本转换为文字编码;
向量确定模块,用于将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量;
向量拼接模块,用于通过所述情感类别识别模型的向量拼接层,拼接每个文字编码向量以及每个表情编码向量,得到所述待识别文本的文本特征向量;
类别确定模块,用于将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别。
进一步的,所述向量确定模块在用于将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量时,所述向量确定模块用于:
将每个待处理文字文本的文字编码输入至向量编码层中的文字编码子层,得到每个待处理文字文本的文字编码向量;
将每个待处理表情符号的表情编码输入至向量编码层中的表情编码子层,得到每个待处理表情符号的表情编码向量。
进一步的,所述类别确定模块在用于将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别时,所述类别确定模块用于:
将所述文本特征向量输入至所述情感分类层中的概率预测子层,确定所述待识别文本为每种情感类别的类别概率;
基于所述待识别文本为每种情感类别的类别概率,通过所述情感分类层中的类别确定子层,将类别概率最大的情感类别确定为所述待识别文本的情感类别。
进一步的,所述编码模块用于通过以下步骤将每个待处理表情符号转换为表情编码:
针对于每个待处理表情符号,从该待处理表情符号中提取出用于表征该待处理表情符号的表情图像特征;
基于该待处理表情符号的表情图像特征,确定该待处理表情符号所属的表情类别组;
将所述表情类别组的表情编码确定为该待处理表情符号的表情编码。
进一步的,所述识别装置还包括编码分配模块,所述编码分配模块用于:
获取多个样本语言文本;
从所述多个样本语言文本中提取出来源不同的多个样本表情符号;
针对于每个样本表情符号,从该表情符号中提取出用于表征该样本表情符号的表情图像特征;
基于每个样本表情符号的表情图像特征,对所述多个样本表情符号进行聚类处理,确定出多个表情类别组;
针对于每个表情类别组,为该表情类别组分配统一的表情编码。
本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的文本情感的识别方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的文本情感的识别方法的步骤。
本申请实施例提供的文本情感的识别方法、装置、电子设备及可读存储介质,从获取到的待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本;针对于每个待处理表情符号和每个待处理文字文本,分别将该待处理表情符号转换为表情编码,以及将该待处理文字文本转换为文字编码;将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量;通过所述情感类别识别模型的向量拼接层,拼接每个文字编码向量以及每个表情编码向量,得到所述待识别文本的文本特征向量;将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别。这样,便可以结合待识别文本中的标签符号,对待识别文本的情感类别进行识别,从而,可以更加准确地确定出待识别文本的情感类别,有助于提高识别结果的准确性。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种文本情感的识别方法的流程图;
图2为本申请实施例所提供的一种文本情感的识别装置的结构示意图之一;
图3为本申请实施例所提供的一种文本情感的识别装置的结构示意图之二;
图4为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。
经研究发现,随着互联网技术的发展,人们越来越习惯于在各种社交媒体平台、电子商务平台以及点评分享平台上分享自己的使用产品的感受和经验,这些都被称用户生成内容(UGC),品牌运行商为了更好的进行用户洞察分析,通过采集用户生成内容,年轻的用户为了能更好表达自己的感受和情感,往往会使用很多emoji符号,这些emoji符号在很多情况下是被过滤掉了,因此,在很多情况下是无法准确地对用户的情感进行揣测的。因此,如何准确的识别存在表情符号的情感类别成为了亟待解决的问题。
基于此,本申请实施例提供了一种文本情感的识别方法,可以准确地识别出待识别文本的情感类别。
请参阅图1,图1为本申请实施例所提供的一种文本情感的识别方法的流程图。如图1中所示,本申请实施例提供的文本情感的识别方法,包括:
S101、从获取到的待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本。
S102、针对于每个待处理表情符号和每个待处理文字文本,分别将该待处理表情符号转换为表情编码,以及将该待处理文字文本转换为文字编码。
S103、将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量。
S104、通过所述情感类别识别模型的向量拼接层,拼接每个文字编码向量以及每个表情编码向量,得到所述待识别文本的文本特征向量。
S105、将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别。
在人们的日常对话中,通常会将表情符号添加在对话文本中,从而,更好的表达出自己所要表达的情感,因此,对于一段待识别文本来说,存在既存在文字文本,又存在表情符号的情况。
在步骤S101中,分别对获取到的待识别文本进行表情符号识别和文字文本识别,从待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本,具体的,可通过自然语音处理技术从待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本。
由于,需要通过情感类别识别模型来确定待识别文本的情感类别,因此,需要将待识别文本中待处理表情符号和待处理文字文本分别的转换为编码的形式,以在后续的过程中构成用于表征待识别文本的文本特征向量。
在步骤S102中,针对于待识别文本中的每个待处理表情符号,将其转换为表情编码;针对于待识别文本中的每个待处理文字文本,将其转换为文字编码。
这里,每个待处理表情符号的表情编码是预先设置好的,可以通过识别待处理表情符号来确定出该待处理表情符号的表情编码;相应的,每个待处理文字文本的文字编码也是预先设置好的,可以通过是识别待处理文字文本,将每个字转换为文字编码;也或者,可以将每个词组(存在多个字的情况)转换为文字编码,可视具体情况而定,在此不做限制。
由于,来自于不同来源的表情符号在表现形式上存在差异,因此,为了能够使用相同的表情编码统一表示表现形式不同但表示意思相同的表情符号,可以根据每个表情符号所属表情类别组来确定每个待处理表情符号的待处理表情编码。
在一种实施方式中,通过以下步骤将每个待处理表情符号转换为表情编码:针对于每个待处理表情符号,从该待处理表情符号中提取出用于表征该待处理表情符号的表情图像特征;基于该待处理表情符号的表情图像特征,确定该待处理表情符号所属的表情类别组;将所述表情类别组的表情编码确定为该待处理表情符号的表情编码。
该步骤中,针对于每个待处理表情符号,通过识别待处理表情符号,确定出表征该待处理表情符号的表情图像特征,进而,根据表情图像特征,确定该待处理表情符号所属的表情类别组,这里,属于同一表情类别组中的表情符号为在表现形式上存在差异,但表达意义相同的表情符号;最后,将所属表情类别组的表情编码确定为该待处理表情符号的表情编码。
在一种实施方式中,通过以下步骤确定每个表情类别组的表情编码:获取多个样本语言文本;从所述多个样本语言文本中提取出来源不同的多个样本表情符号;针对于每个样本表情符号,从该表情符号中提取出用于表征该样本表情符号的表情图像特征;基于每个样本表情符号的表情图像特征,对所述多个样本表情符号进行聚类处理,确定出多个表情类别组;针对于每个表情类别组,为该表情类别组分配统一的表情编码。
该步骤中,获取多个来源不同的样本语言文本,从多个样本语言文本中提取出多个样本表情符号,由于,样本语言文本的来源不同,显然,提取出的多个样本表情符号的来源也就不同,因此,多个样本表情符号在表现形式上存在差异。
分别从每个样本表情符号中提取出表情图像特征,这里,表情图像特征能够表达出样本表情符号的表达意义,因此,便可以对具有相同表达意义的样本表情符号进行聚类,将具有相同表达意义的样本表情符号聚为一类,确定出多个表情类别组。
为每个表情类别组分配唯一的表情编码,在将待处理表情符号转换为表情编码时,便可以使用所属表情类别组的表情编码为待处理表情符号进行编码,以此来保证即使是来源不同的表情符号,只要有相同的表达意义,便可以具有相同的表情编码。
在步骤S103中,将确定出的每个文字编码和每个表情编码输入至情感类别识别模型的向量编码层,通过向量编码层将每个待处理文字文本的文字编码转换为文字编码向量,以及将每个待处理表情符号转换为表情编码向量。
这里,每个待处理表情符号的表情编码向量仅能够表征该待处理表情符号,而每个待处理文字文本的文字编码向量也仅能够代表该待处理文字文本,因此,为了能够得到表征整个待识别文本的文本特征向量,需要拼接每个文字编码向量和每个表情编码向量。
在一种实施方式在,步骤S103包括:将每个待处理文字文本的文字编码输入至向量编码层中的文字编码子层,得到每个待处理文字文本的文字编码向量;将每个待处理表情符号的表情编码输入至向量编码层中的表情编码子层,得到每个待处理表情符号的表情编码向量。
具体的,通过以下步骤训练情感类别识别模型的向量编码层:
步骤1:获取训练样本集中每个训练文本样本中每个样本表情符号的样本表情编码和样本表情编码向量,以及每个样本文字文本的样本文字编码和样本文字编码向量。
步骤2:将每个样本表情符号的样本表情编码作为输入特征,将每个样本表情符号的样本表情编码向量作为输出特征,训练构建好的表情编码子层,得到训练好的表情编码子层。
步骤3:将每个样本文字文本的样本文字编码作为输入特征,将每个样本文字文本的样本文字编码向量作为输出特征,训练构建好的文字编码子层,得到训练好的文字编码子层。
步骤4:基于训练好的表情编码子层以及训练好的文字编码子层,得到训练好的向量编码层。
需要说明的是,本申请中的情感类别识别模型为深度神经网络,因此,在训练时采用深度学习技术来训练构建好的各个网络层。
在步骤S104中,通过情感类别识别模型的向量拼接层,拼接每个文字编码向量以及每个表情编码向量,具体的,可以以列向量的形式进行拼接得到待识别文本的文本特征向量;也可以是以行向量的形式进行拼接得到待识别文本的文本特征向量,在此不做限制。
在一种实施方式中,通过以下步骤训练情感类别识别模型的向量拼接层:
步骤5:获取训练样本集中每个训练文本样本的样本特征向量。
步骤6:将每个训练文本样本中的每个样本表情符号的样本表情编码向量和每个样本文字文本的样本文字编码向量作为输入特征,将每个训练文本样本的样本特征向量作为输出特征,训练构建好的向量拼接层,得到训练好的向量拼接层。
在步骤S105中,将拼接得到的文本特征向量输入至情感类别识别模型中的情感分类层,确定出待识别文本的情感类别。
在一种实施方式中,步骤S105包括:将所述文本特征向量输入至所述情感分类层中的概率预测子层,确定所述待识别文本为每种情感类别的类别概率;基于所述待识别文本为每种情感类别的类别概率,通过所述情感分类层中的类别确定子层,将类别概率最大的情感类别确定为所述待识别文本的情感类别。
该步骤中,在确定待识别文本的情感类别时,首先,通过情感分类层中的概率预测子层确定待识别文本为每种情感类别的类别概率;然后,再通过情感分类层中的类别确定子层,将类别概率最大的情感类别,确定为待识别文本的情感类别;
具体的,通过以下步骤训练情感类别识别模型的情感分类层:
步骤7:获取训练样本集中每个训练文本样本为每种情感类别的概率标签,以及每个训练文本样本的情感类别标签。
步骤8:将每个训练文本样本的样本特征向量作为输入特征,将每个训练文本样本为每种情感类别的概率标签作为输出特征,训练构建好的概率预测子层,得到训练好的概率预测子层。
步骤9:将每个训练文本样本为每种情感类别的概率标签作为输入特征,将每个训练文本样本的情感类别标签作为输出特征,训练构建好的类别确定子层,得到训练好的类别确定子层。
步骤10:基于训练好的概率预测子层和训练好的类别确定子层,得到训练好的情感分类层。
需要说明的是,本申请中的情感类别识别模型为包括有全连接网络的TextCNN网络,可以准确地预测待识别文本为每种情感类别的概率。
本申请实施例提供的文本情感的识别方法,从获取到的待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本;针对于每个待处理表情符号和每个待处理文字文本,分别将该待处理表情符号转换为表情编码,以及将该待处理文字文本转换为文字编码;将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量;通过所述情感类别识别模型的向量拼接层,拼接每个文字编码向量以及每个表情编码向量,得到所述待识别文本的文本特征向量;将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别。这样,便可以结合待识别文本中的标签符号,对待识别文本的情感类别进行识别,从而,可以更加准确地确定出待识别文本的情感类别,有助于提高识别结果的准确性。
请参阅图2、图3,图2为本申请实施例所提供的一种文本情感的识别装置的结构示意图之一,图3为本申请实施例所提供的一种文本情感的识别装置的结构示意图之二。如图2中所示,所述识别装置200包括:
识别模块210,用于从获取到的待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本;
编码模块220,用于针对于每个待处理表情符号和每个待处理文字文本,分别将该待处理表情符号转换为表情编码,以及将该待处理文字文本转换为文字编码;
向量确定模块230,用于将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量;
向量拼接模块240,用于通过所述情感类别识别模型的向量拼接层,拼接每个文字编码向量以及每个表情编码向量,得到所述待识别文本的文本特征向量;
类别确定模块250,用于将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别。
进一步的,如图3所示,所述识别装置200还包括编码分配模块260,所述编码分配模块260用于:
获取多个样本语言文本;
从所述多个样本语言文本中提取出来源不同的多个样本表情符号;
针对于每个样本表情符号,从该表情符号中提取出用于表征该样本表情符号的表情图像特征;
基于每个样本表情符号的表情图像特征,对所述多个样本表情符号进行聚类处理,确定出多个表情类别组;
针对于每个表情类别组,为该表情类别组分配统一的表情编码。
进一步的,所述编码模块220用于通过以下步骤将每个待处理表情符号转换为表情编码:
针对于每个待处理表情符号,从该待处理表情符号中提取出用于表征该待处理表情符号的表情图像特征;
基于该待处理表情符号的表情图像特征,确定该待处理表情符号所属的表情类别组;
将所述表情类别组的表情编码确定为该待处理表情符号的表情编码。
进一步的,所述向量确定模块230在用于将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量时,所述向量确定模块230用于:
将每个待处理文字文本的文字编码输入至向量编码层中的文字编码子层,得到每个待处理文字文本的文字编码向量;
将每个待处理表情符号的表情编码输入至向量编码层中的表情编码子层,得到每个待处理表情符号的表情编码向量。
进一步的,所述类别确定模块250在用于将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别时,所述类别确定模块250用于:
将所述文本特征向量输入至所述情感分类层中的概率预测子层,确定所述待识别文本为每种情感类别的类别概率;
基于所述待识别文本为每种情感类别的类别概率,通过所述情感分类层中的类别确定子层,将类别概率最大的情感类别确定为所述待识别文本的情感类别。
本申请实施例提供的文本情感的识别装置,从获取到的待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本;针对于每个待处理表情符号和每个待处理文字文本,分别将该待处理表情符号转换为表情编码,以及将该待处理文字文本转换为文字编码;将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量;通过所述情感类别识别模型的向量拼接层,拼接每个文字编码向量以及每个表情编码向量,得到所述待识别文本的文本特征向量;将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别。这样,便可以结合待识别文本中的标签符号,对待识别文本的情感类别进行识别,从而,可以更加准确地确定出待识别文本的情感类别,有助于提高识别结果的准确性。
请参阅图4,图4为本申请实施例所提供的一种电子设备的结构示意图。如图4中所示,所述电子设备400包括处理器410、存储器420和总线430。
所述存储器420存储有所述处理器410可执行的机器可读指令,当电子设备400运行时,所述处理器410与所述存储器420之间通过总线430通信,所述机器可读指令被所述处理器410执行时,可以执行如上述图1所示方法实施例中的文本情感的识别方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的文本情感的识别方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种文本情感的识别方法,其特征在于,所述识别方法包括:
从获取到的待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本;
针对于每个待处理表情符号和每个待处理文字文本,分别将该待处理表情符号转换为表情编码,以及将该待处理文字文本转换为文字编码;
将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量;
通过所述情感类别识别模型的向量拼接层,拼接每个文字编码向量以及每个表情编码向量,得到所述待识别文本的文本特征向量;
将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别。
2.根据权利要求1所述的识别方法,其特征在于,所述将每个文字编码和每个表情编码输入至情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量,包括:
将每个待处理文字文本的文字编码输入至向量编码层中的文字编码子层,得到每个待处理文字文本的文字编码向量;
将每个待处理表情符号的表情编码输入至向量编码层中的表情编码子层,得到每个待处理表情符号的表情编码向量。
3.根据权利要求1所述的识别方法,其特征在于,所述将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别,包括:
将所述文本特征向量输入至所述情感分类层中的概率预测子层,确定所述待识别文本为每种情感类别的类别概率;
基于所述待识别文本为每种情感类别的类别概率,通过所述情感分类层中的类别确定子层,将类别概率最大的情感类别确定为所述待识别文本的情感类别。
4.根据权利要求1所述的识别方法,其特征在于,通过以下步骤将每个待处理表情符号转换为表情编码:
针对于每个待处理表情符号,从该待处理表情符号中提取出用于表征该待处理表情符号的表情图像特征;
基于该待处理表情符号的表情图像特征,确定该待处理表情符号所属的表情类别组;
将所述表情类别组的表情编码确定为该待处理表情符号的表情编码。
5.根据权利要求1所述的识别方法,其特征在于,所述识别方法还包括:
获取多个样本语言文本;
从所述多个样本语言文本中提取出来源不同的多个样本表情符号;
针对于每个样本表情符号,从该表情符号中提取出用于表征该样本表情符号的表情图像特征;
基于每个样本表情符号的表情图像特征,对所述多个样本表情符号进行聚类处理,确定出多个表情类别组;
针对于每个表情类别组,为该表情类别组分配统一的表情编码。
6.一种文本情感的识别装置,其特征在于,所述识别装置包括:
识别模块,用于从获取到的待识别文本中识别出至少一个待处理表情符号和至少一个待处理文字文本;
编码模块,用于针对于每个待处理表情符号和每个待处理文字文本,分别将该待处理表情符号转换为表情编码,以及将该待处理文字文本转换为文字编码;
向量确定模块,用于将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量;
向量拼接模块,用于通过所述情感类别识别模型的向量拼接层,拼接每个文字编码向量以及每个表情编码向量,得到所述待识别文本的文本特征向量;
类别确定模块,用于将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别。
7.根据权利要求6所述的识别装置,其特征在于,所述向量确定模块在用于将每个文字编码和每个表情编码输入至预先训练好的情感类别识别模型的向量编码层,确定每个待处理文字文本的文字编码向量以及每个待处理表情符号的表情编码向量时,所述向量确定模块用于:
将每个待处理文字文本的文字编码输入至向量编码层中的文字编码子层,得到每个待处理文字文本的文字编码向量;
将每个待处理表情符号的表情编码输入至向量编码层中的表情编码子层,得到每个待处理表情符号的表情编码向量。
8.根据权利要求6所述的识别装置,其特征在于,所述类别确定模块在用于将所述文本特征向量输入至所述情感类别识别模型中的情感分类层,确定所述待识别文本的情感类别时,所述类别确定模块用于:
将所述文本特征向量输入至所述情感分类层中的概率预测子层,确定所述待识别文本为每种情感类别的类别概率;
基于所述待识别文本为每种情感类别的类别概率,通过所述情感分类层中的类别确定子层,将类别概率最大的情感类别确定为所述待识别文本的情感类别。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过所述总线进行通信,所述机器可读指令被所述处理器运行时执行如权利要求1至5任一所述的文本情感的识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至5任一所述的文本情感的识别方法的步骤。
CN202110907972.9A 2021-08-09 2021-08-09 文本情感的识别方法、装置、电子设备及可读存储介质 Pending CN113609865A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110907972.9A CN113609865A (zh) 2021-08-09 2021-08-09 文本情感的识别方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110907972.9A CN113609865A (zh) 2021-08-09 2021-08-09 文本情感的识别方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN113609865A true CN113609865A (zh) 2021-11-05

Family

ID=78339997

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110907972.9A Pending CN113609865A (zh) 2021-08-09 2021-08-09 文本情感的识别方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN113609865A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116108836A (zh) * 2023-04-10 2023-05-12 之江实验室 文本情感识别方法、装置、计算机设备及可读存储介质
CN116228252A (zh) * 2023-02-10 2023-06-06 广东盛迪嘉电子商务股份有限公司 一种后台客服服务终端

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104516947A (zh) * 2014-12-03 2015-04-15 浙江工业大学 一种融合显性和隐性特征的中文微博情感分析方法
CN109948158A (zh) * 2019-03-15 2019-06-28 南京邮电大学 基于环境元嵌入和深度学习的情感倾向性分析方法
CN110750648A (zh) * 2019-10-21 2020-02-04 南京大学 一种基于深度学习和特征融合的文本情感分类方法
CN111898384A (zh) * 2020-05-30 2020-11-06 中国兵器科学研究院 一种文本情感识别方法、装置、存储介质及电子设备
CN113158656A (zh) * 2020-12-25 2021-07-23 北京中科闻歌科技股份有限公司 讽刺内容识别方法、装置、电子设备以及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104516947A (zh) * 2014-12-03 2015-04-15 浙江工业大学 一种融合显性和隐性特征的中文微博情感分析方法
CN109948158A (zh) * 2019-03-15 2019-06-28 南京邮电大学 基于环境元嵌入和深度学习的情感倾向性分析方法
CN110750648A (zh) * 2019-10-21 2020-02-04 南京大学 一种基于深度学习和特征融合的文本情感分类方法
CN111898384A (zh) * 2020-05-30 2020-11-06 中国兵器科学研究院 一种文本情感识别方法、装置、存储介质及电子设备
CN113158656A (zh) * 2020-12-25 2021-07-23 北京中科闻歌科技股份有限公司 讽刺内容识别方法、装置、电子设备以及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116228252A (zh) * 2023-02-10 2023-06-06 广东盛迪嘉电子商务股份有限公司 一种后台客服服务终端
CN116108836A (zh) * 2023-04-10 2023-05-12 之江实验室 文本情感识别方法、装置、计算机设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN111666761B (zh) 细粒度情感分析模型训练方法及装置
CN111125354A (zh) 文本分类方法及装置
CN112507704B (zh) 多意图识别方法、装置、设备及存储介质
CN111858843A (zh) 一种文本分类方法及装置
CN113609865A (zh) 文本情感的识别方法、装置、电子设备及可读存储介质
CN112347787A (zh) 方面级别情感分类方法、装置、设备及可读存储介质
CN108205524B (zh) 文本数据处理方法和装置
CN113094478B (zh) 表情回复方法、装置、设备及存储介质
CN113990352B (zh) 用户情绪识别与预测方法、装置、设备及存储介质
CN113283238A (zh) 文本数据处理的方法和装置、电子设备和存储介质
CN112860896A (zh) 语料泛化方法及用于工业领域的人机对话情感分析方法
CN111091004A (zh) 一种语句实体标注模型的训练方法、训练装置及电子设备
CN114528851B (zh) 回复语句确定方法、装置、电子设备和存储介质
CN108021609B (zh) 文本情感分类方法、装置、计算机设备和存储介质
CN115796141A (zh) 文本数据增强方法和装置、电子设备、存储介质
CN115964997A (zh) 选择题的混淆选项生成方法及装置、电子设备、存储介质
CN114218381B (zh) 立场识别方法、装置、设备及介质
CN113345409B (zh) 语音合成方法、装置、电子设备及计算机可读存储介质
CN114676699A (zh) 实体情感分析方法、装置、计算机设备和存储介质
CN115017906A (zh) 一种针对文本中实体的识别方法、装置及存储介质
CN111611394B (zh) 一种文本分类方法、装置、电子设备及可读存储介质
CN115292495A (zh) 情绪分析方法、装置、电子设备及存储介质
CN114398482A (zh) 一种词典构造方法、装置、电子设备及存储介质
CN112329478A (zh) 一种构建因果关系确定模型的方法、装置和设备
CN111143559A (zh) 基于三元组的词云展示方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211228

Address after: A111, 1f, building 3, No. 1, zone 1, Lize Zhongyuan, Wangjing emerging industrial zone, Chaoyang District, Beijing 100020

Applicant after: MIAOZHEN INFORMATION TECHNOLOGY Co.,Ltd.

Address before: Floor 29, 30, 31, 32, No. 701, Yunjin Road, Xuhui District, Shanghai, 200030

Applicant before: Shanghai minglue artificial intelligence (Group) Co.,Ltd.