CN110377740A - 情感极性分析方法、装置、电子设备及存储介质 - Google Patents
情感极性分析方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110377740A CN110377740A CN201910661998.2A CN201910661998A CN110377740A CN 110377740 A CN110377740 A CN 110377740A CN 201910661998 A CN201910661998 A CN 201910661998A CN 110377740 A CN110377740 A CN 110377740A
- Authority
- CN
- China
- Prior art keywords
- text
- training
- target
- vector
- participle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种情感极性分析方法,包括:对目标文本进行分词处理,得到多个分词;分别确定多个分词的词向量,并根据多个分词的词向量确定目标文本的文本语义向量;利用情感分类模型对目标文本的文本语义向量和目标分词的词向量进行分析,确定目标分词的情感极性。在对目标分词进行情感极性预测过程中所使用的情感分类模型,其编码器至少包括多个卷积层,其解码器至少包括多个反卷积层,并且对该模型进行训练过程中,所使用的训练依据至少包括训练文本的语义向量重构误差和词向量重构误差,这使得该模型能够更好的捕捉文本的语义信息和目标分词的信息之间的复杂关系,因此,针对文本中目标分词预测得到的情感极性具有更好的准确性和可靠性。
Description
技术领域
本申请属于数据处理技术领域,尤其涉及情感极性分析方法、装置、电子设备及存储介质。
背景技术
利用自然语言处理技术对文本中的情感进行挖掘,被称为情感分析。目前,情感分析技术被越来越多的应用到商业场景中,在消费决策、舆情分析、个性化推荐等领域有重要作用。例如:用户在电商平台购物后,通常会在该电商平台发表对商品的评价;用户通过信息推广平台选择某个商家,在该商家消费后,用户通常会在该信息推广平台发表对该商家的评价;用户在使用某项服务(线上服务和线下服务)后,会在网络上发表针对该服务的评价。通过对用户发表的评价进行情感分析,能够根据分析结果调整后续的处理策略。
但是,基于现有的情感极性分析方法,普遍存在分析结果的准确性和可靠性较低的问题。
发明内容
有鉴于此,本申请的目的在于提供一种情感极性分析方法、装置、电子设备及存储介质,以提高情感极性分析结果的准确性和可靠性。
为实现上述目的,本申请提供如下技术方案:
一方面,本申请提供一种情感极性分析方法,包括:
获得情感分析请求,所述情感分析请求携带有目标文本;
对所述目标文本进行分词处理,得到所述目标文本包含的多个分词;
分别确定所述多个分词的词向量;
基于所述多个分词的词向量确定所述目标文本的文本语义向量;
调用预先完成训练的情感分类模型;
基于所述情感分类模型对所述目标文本的文本语义向量和目标分词的词向量进行分析,确定所述目标分词的情感极性,其中,所述目标分词为所述多个分词中的名词;
所述情感分类模型包括编码器、解码器和分类器,所述编码器至少包括多个卷积层,所述解码器至少包括多个反卷积层,在所述情感分类模型的训练过程中,至少基于语义向量重构误差和词向量重构误差调整所述情感分类模型的参数,其中,所述语义向量重构误差基于训练文本的文本语义向量和所述解码器解码得到的重构文本语义向量确定,所述词向量重构误差基于所述训练文本中目标训练分词的词向量和所述解码器解码得到的所述目标训练分词的重构词向量确定。
可选的,所述情感分类模型的训练过程,包括:
获得训练文本;
对所述训练文本进行分词处理,得到所述训练文本包含的多个训练分词;
分别确定所述多个训练分词的词向量;
基于所述多个训练分词的词向量确定所述训练文本的文本语义向量;
将所述训练文本的文本语义向量和所述训练文本中目标训练分词的词向量输入待训练的情感分类模型;其中,所述情感分类模型的编码器用于对所述训练文本的文本语义向量进行卷积运算,得到所述训练文本的特征向量,对所述训练文本的特征向量和所述训练文本中目标训练分词的词向量进行运算,输出综合特征向量,所述情感分类模型的解码器用于对所述编码器输出的综合特征向量进行逆运算,输出所述训练文本的重构文本语义向量和所述训练文本中目标训练分词的重构词向量;
根据所述训练文本的文本语义向量和所述解码器输出的所述训练文本的重构文本语义向量确定语义向量重构误差,根据所述训练文本中目标训练分词的词向量和所述解码器输出的所述目标训练分词的重构词向量确定词向量重构误差;
根据所述语义向量重构误差和所述词向量重构误差确定所述待训练的情感分类模型的第一损失函数的输出值;
以最小化所述待训练的情感分类模型的第一损失函数的输出值为训练目标,更新所述待训练的情感分类模型的参数,直至所述第一损失函数的输出值小于或等于预设阈值。
可选的,所述情感分类模型的训练过程,包括:
获得训练文本,所述训练文本携带有目标训练分词的情感极性标注信息;
对所述训练文本进行分词处理,得到所述训练文本包含的多个训练分词;
分别确定所述多个训练分词的词向量;
基于所述多个训练分词的词向量确定所述训练文本的文本语义向量;
将所述训练文本的文本语义向量和所述训练文本中目标训练分词的词向量输入待训练的情感分类模型;其中,所述情感分类模型的编码器用于对所述训练文本的文本语义向量进行卷积运算,得到所述训练文本的特征向量,对所述训练文本的特征向量和所述训练文本中目标训练分词的词向量进行运算,输出综合特征向量,所述情感分类模型的解码器用于对所述编码器输出的综合特征向量进行逆运算,输出所述训练文本的重构文本语义向量和所述训练文本中目标训练分词的重构词向量,所述分类器用于基于所述综合特征向量输出所述目标训练分词的情感极性预测结果;
根据所述训练文本的文本语义向量和所述解码器输出的所述训练文本的重构文本语义向量确定语义向量重构误差,根据所述训练文本中目标训练分词的词向量和所述解码器输出的所述目标训练分词的重构词向量确定词向量重构误差,根据所述目标训练分词的情感极性预测结果和所述目标训练分词的情感极性标注信息确定分类误差;
根据所述语义向量重构误差、所述词向量重构误差和所述分类误差确定所述待训练的情感分类模型的第二损失函数的输出值;
以最小化所述待训练的情感分类模型的第二损失函数的输出值为训练目标,更新所述待训练的情感分类模型的参数,直至所述第二损失函数的输出值小于或等于预设阈值。
另一方面,本申请提供一种情感极性分析装置,包括:
请求获取单元,用于获得情感分析请求,所述情感分析请求携带有目标文本;
文本处理单元,用于对所述目标文本进行分词处理,得到所述目标文本包含的多个分词;
词向量确定单元,用于分别确定所述多个分词的词向量;
文本语义向量确定单元,用于基于所述多个分词的词向量确定所述目标文本的文本语义向量;
模型调用单元,用于调用预先完成训练的情感分类模型;
情感极性分析单元,用于基于所述情感分类模型对所述目标文本的文本语义向量和目标分词的词向量进行分析,确定所述目标分词的情感极性,其中,所述目标分词为所述多个分词中的名词;
所述情感分类模型包括编码器、解码器和分类器,所述编码器至少包括多个卷积层,所述解码器至少包括多个反卷积层,在所述情感分类模型的训练过程中,至少基于语义向量重构误差和词向量重构误差调整所述情感分类模型的参数,其中,所述语义向量重构误差基于训练文本的文本语义向量和所述解码器解码得到的重构文本语义向量确定,所述词向量重构误差基于所述训练文本中目标训练分词的词向量和所述解码器解码得到的所述目标训练分词的重构词向量确定。
可选的,在上述装置的基础上进一步设置第一模型训练单元,所述第一模型训练单元用于:
获得训练文本;对所述训练文本进行分词处理,得到所述训练文本包含的多个训练分词;分别确定所述多个训练分词的词向量;基于所述多个训练分词的词向量确定所述训练文本的文本语义向量;将所述训练文本的文本语义向量和所述训练文本中目标训练分词的词向量输入待训练的情感分类模型;其中,所述情感分类模型的编码器用于对所述训练文本的文本语义向量进行卷积运算,得到所述训练文本的特征向量,对所述训练文本的特征向量和所述训练文本中目标训练分词的词向量进行运算,输出综合特征向量,所述情感分类模型的解码器用于对所述编码器输出的综合特征向量进行逆运算,输出所述训练文本的重构文本语义向量和所述训练文本中目标训练分词的重构词向量;根据所述训练文本的文本语义向量和所述解码器输出的所述训练文本的重构文本语义向量确定语义向量重构误差,根据所述训练文本中目标训练分词的词向量和所述解码器输出的所述目标训练分词的重构词向量确定词向量重构误差;根据所述语义向量重构误差和所述词向量重构误差确定所述待训练的情感分类模型的第一损失函数的输出值;以最小化所述待训练的情感分类模型的第一损失函数的输出值为训练目标,更新所述待训练的情感分类模型的参数,直至所述第一损失函数的输出值小于或等于预设阈值。
可选的,在上述装置的基础上进一步设置第二模型训练单元,所述第二模型训练单元用于:
获得训练文本,所述训练文本携带有目标训练分词的情感极性标注信息;对所述训练文本进行分词处理,得到所述训练文本包含的多个训练分词;分别确定所述多个训练分词的词向量;基于所述多个训练分词的词向量确定所述训练文本的文本语义向量;将所述训练文本的文本语义向量和所述训练文本中目标训练分词的词向量输入待训练的情感分类模型;其中,所述情感分类模型的编码器用于对所述训练文本的文本语义向量进行卷积运算,得到所述训练文本的特征向量,对所述训练文本的特征向量和所述训练文本中目标训练分词的词向量进行运算,输出综合特征向量,所述情感分类模型的解码器用于对所述编码器输出的综合特征向量进行逆运算,输出所述训练文本的重构文本语义向量和所述训练文本中目标训练分词的重构词向量,所述分类器用于基于所述综合特征向量输出所述目标训练分词的情感极性预测结果;根据所述训练文本的文本语义向量和所述解码器输出的所述训练文本的重构文本语义向量确定语义向量重构误差,根据所述训练文本中目标训练分词的词向量和所述解码器输出的所述目标训练分词的重构词向量确定词向量重构误差,根据所述目标训练分词的情感极性预测结果和所述目标训练分词的情感极性标注信息确定分类误差;根据所述语义向量重构误差、所述词向量重构误差和所述分类误差确定所述待训练的情感分类模型的第二损失函数的输出值;以最小化所述待训练的情感分类模型的第二损失函数的输出值为训练目标,更新所述待训练的情感分类模型的参数,直至所述第二损失函数的输出值小于或等于预设阈值。
另一方面,本申请提供一种电子设备,包括处理器和存储器;
所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器用于存储所述程序,所述程序至少用于:
获得情感分析请求,所述情感分析请求携带有目标文本;
对所述目标文本进行分词处理,得到所述目标文本包含的多个分词;
分别确定所述多个分词的词向量;
基于所述多个分词的词向量确定所述目标文本的文本语义向量;
调用预先完成训练的情感分类模型;
基于所述情感分类模型对所述目标文本的文本语义向量和目标分词的词向量进行分析,确定所述目标分词的情感极性,其中,所述目标分词为所述多个分词中的名词;
所述情感分类模型包括编码器、解码器和分类器,所述编码器至少包括多个卷积层,所述解码器至少包括多个反卷积层,在所述情感分类模型的训练过程中,至少基于语义向量重构误差和词向量重构误差调整所述情感分类模型的参数,其中,所述语义向量重构误差基于训练文本的文本语义向量和所述解码器解码得到的重构文本语义向量确定,所述词向量重构误差基于所述训练文本中目标训练分词的词向量和所述解码器解码得到的所述目标训练分词的重构词向量确定。
另一方面,本申请提供一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上任意一种情感极性分析方法。
由此可见,本申请的有益效果为:
本申请公开的情感极性分析方法,首先对目标文本进行分词处理,得到目标文本包含的多个分词,之后分别确定多个分词的词向量,并根据多个分词的词向量确定目标文本的文本语义向量,之后利用预先完成训练的情感分类模型对目标文本的文本语义向量和目标分词的词向量进行分析,从而确定目标分词的情感极性。在对目标分词进行情感极性预测过程中所使用的情感分类模型,其编码器至少包括多个卷积层,其解码器至少包括多个反卷积层,并且对该模型进行训练过程中,所使用的训练依据至少包括训练文本的语义向量重构误差和词向量重构误差,这使得该模型能够更好的捕捉文本的语义信息和目标分词的信息之间的复杂关系,因此,针对文本中目标分词预测得到的情感极性具有更好的准确性和可靠性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种情感分类模型的结构框图;
图2为本申请实施例提供的一种情感分类模型的结构图;
图3为本申请实施例提供的一种情感分类模型的训练方法的流程图;
图4为本申请实施例提供的另一种情感分类模型的训练方法的流程图;
图5为本申请实施例提供的一种情感极性分析方法的流程图;
图6为本申请实施例提供的在一个应用场景下的情感极性分析方法的信令图;
图7为本申请实施例提供的一种情感极性分析装置的结构示意图;
图8为本申请实施例提供的一种电子设备的硬件结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种情感极性分析方法。本申请公开的情感极性分析方法可以应用于服务器或者终端。其中,前述的终端可以是诸如台式计算机、移动终端(例如智能手机和平板电脑)等电子设备。前述的服务器可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者是一个云计算服务中心。
为了便于对本申请实施例提供的情感极性分析方法进行说明,在此首先对本申请实施例提供的情感分类模型及其训练过程进行介绍。
参见图1,图1为本申请实施例提供的一种情感分类模型的结构图。如图1中所示,情感分类模型包括编码器11、解码器12和分类器13。
其中:
编码器11至少包括多个卷积层。编码器11的输入包括文本的文本语义向量和目标分词的词向量,编码器11对文本的文本语义向量进行至少一次卷积运算,以获得文本的特征向量,之后编码器11对文本的特征向量和目标分词的词向量进行运算,以获得综合特征向量。
解码器12至少包括多个反卷积层。解码器12的输入为编码器11输出的综合特征向量,解码器12对综合特征向量进行逆运算,重构出文本的文本语义向量和目标分词的词向量。由于解码器12输出的文本语义向量和词向量均为重构出的,为了与输入编码器11的文本语义向量和词向量进行区分,将解码器12输出的文本语义向量称为重构文本语义向量,将解码器12输出的词向量称为重构词向量。
分类器13基于编码器11输出的综合特征向量输出目标分词的情感极性预测结果。
在训练情感分类模型的过程中,至少基于语义向量重构误差和词向量重构误差调整情感分类模型的参数。其中,语义向量重构误差基于训练文本的文本语义向量和解码器解码得到的重构文本语义向量确定,词向量重构误差基于训练文本中目标训练分词的词向量和解码器解码得到的目标训练分词的重构词向量确定。
参见图2,图2中示出了情感分类模型的一种具体结构。该情感分类模型包括编码器11、解码器12和分类器13。
编码器11包括多个卷积层、拼接层和全连接层111。
卷积层1至卷积层n用于对文本的文本语义向量进行卷积运算,得到该文本的特征向量。
具体的,卷积层1对文本的文本语义向量进行卷积运算,得到运算结果,卷积层2对卷积层1的运算结果进行卷积运算,得到运算结果,以此类推,每个卷积层对前一个卷积层的运算结果进行卷积运算,卷积层n的运算结果为该文本的特征向量。需要说明的是,从卷积层1至卷积层n,各卷积层输出的运算结果的总维度是逐渐降低的,每个卷积层的运算结果的维度由该卷积层的卷积核和步长决定。
这里对文本的文本语义向量进行说明。
通过对文本进行分词处理,得到多个分词。需要说明的是,如果文本是中文文本,那么经过分词处理得到的多个分词包括字和词语。例如,对文本“餐厅的环境很好但是服务一般”进行分词处理,得到的分词包括“餐厅”、“的”、“环境”、“很好”、“但是”、“服务”和“一般”。如果文本是英文文本,那么经过分词处理得到的多个分词为单词。例如,对文本“Goodfood but dreadful service at than restaurant”进行分词处理,得到的分词包括“Good”、“food”、“but”、“dreadful”、“service”、“at”、“that”和“restaurant”。
分别获得多个分词的向量,对多个分词的向量进行拼接得到文本的文本语义向量。实施中,可以采用多种方式确定分词的词向量。例如,可以采用CBOW(Continuous Bag-of-Words)模型实现词向量的训练。
在一个可选的实施例中,每个分词的向量均为一个1行N列的矩阵,按照各分词在文本中出现的先后顺序对多个分词的向量进行拼接,得到M行N列的矩阵,该矩阵即为文本的文本语义向量,其中,M为对文本进行分词处理得到的分词的数量。
具体的:文本中第1个分词的向量作为矩阵的第1行元素,文本中的第2个分词的向量作为矩阵的第2行元素,以此类推,文本中的第M个分词的向量作为矩阵的第M行元素。也就是说,文本中的第i个分词的向量作为该文本的文本语义向量的第i行元素,其中,i=1,2,…,M。
拼接层用于对卷积层n输出的运算结果(也就是文本的特征向量,为一个多行多列的矩阵)进行展平处理,得到转换后的特征向量,其中,转换后的特征向量为一行多列的矩阵。拼接层对转换后的文本的特征向量与目标分词的词向量进行拼接,输出拼接后的向量。
其中,拼接层对文本的特征向量进行展平处理具体为:将文本的特征向量的第i行元素连接于第i-1行元素的右侧,其中,i=2,3,…,P,P为文本的特征向量的行数。也就是说,卷积层n输出的运算结果为P行多列的矩阵,拼接层在该矩阵第1行元素的右侧依次连接该矩阵的第2行元素、第3行元素、…、第P行元素,从而完成文本的特征向量的展平处理。
在一个可选的实施例中,拼接层将目标分词的词向量连接于转换后的文本的特征向量的右侧。
在另一个可选的实施例中,拼接层将转换后的文本的特征向量拼接于目标分词的词向量的右侧。
卷积层n+1至卷积层m用于对拼接层输出的向量进行卷积运算,从而抽取文本和目标分词的特征。具体的,卷积层n+1对拼接层输出的向量进行卷积运算,得到运算结果,卷积层n+2对卷积层n+1的运算结果进行卷积运算,得到运算结果,以此类推,每个卷积层对前一个卷积层的运算结果进行卷积运算。需要说明的是,从卷积层n+1至卷积层m,各卷积层输出的运算结果的总维度是逐渐降低的,每个卷积层的运算结果的维度由该卷积层的卷积核和步长决定。
全连接层111对卷积层m的运算结果进行处理,得到综合特征向量,该综合特征向量包含有文本的特征向量和目标分词的特征向量。其中,全连接层对卷积层m的运算结果进行处理主要包括映射和整合。
分类器13基于编码器11输出的综合特征向量输出目标分词的情感极性预测结果。
分类器13输出的目标分词的情感极性预测结果为:该目标分词属于预设的多个情感极性的概率。其中,概率最高的情感极性为该目标分词的预测情感极性。
在一种可选的实施方式中,预设的情感极性包括积极、消极和中立。
在另一种可选的实施方式中,预设的情感极性包括强烈支持、较为支持、中立、较为反对和强烈反对。
解码器12包括多个反卷积层、拆分层和全连接层121。
解码器12的全连接层121对编码器11的全连接层111输出的综合特征向量进行逆处理,得到向量。
反卷积层m至反卷积层n+1用于对解码器12的全连接层121输出的向量进行反卷积运算,从而得到重构向量,该重构向量包括文本的重构特征向量和目标分词的重构词向量。具体的,反卷积层m对解码器12的全连接层输出的向量进行反卷积运算,得到运算结果,反卷积层m-1对反卷积层m的运算结果进行反卷积运算,得到运算结果,以此类推,每个反卷积层对前一个反卷积层的运算结果进行反卷积运算,反卷积层n+1的运算结果输入至拆分层。需要说明的是,用于对解码器12的全连接层121输出的向量进行反卷积运算的反卷积层,与用于对拼接层输出的向量进行卷积运算的卷积层的数量一致。
拆分层用于对反卷积层n+1输出的运算结果进行拆分处理。需要说明的是,拆分层进行拆分处理的规则与拼接层进行拼接的规则相对应。
具体的,如果拼接层将目标分词的词向量连接于转换后的文本的特征向量的右侧,那么拆分层从反卷积层n+1输出的运算结果的右侧拆分出目标分词的重构词向量,其余部分为文本的重构特征向量。如果拼接层将转换后的文本的特征向量拼接于目标分词的词向量的右侧,那么拆分层从反卷积层n+1输出的运算结果的左侧拆分出目标分词的重构词向量,其余部分为文本的重构特征向量。此时,文本的重构特征向量为一行多列的矩阵。
之后,拆分层将文本的重构特征向量处理为P行多列的重构特征向量,这个过程视为反展平处理。
具体的,反卷积层n+1输出的文本的重构特征向量为一个一行多列的矩阵(行矩阵),卷积层n输出的文本的特征向量为P行多列的矩阵,假如该矩阵的列数为Q,那么拆分层将反卷积层n+1输出的行矩阵中的元素按照从左到右的顺序平均划分为多个序列,每个序列包括Q个元素,将划分得到的第1个序列作为矩阵的第1行,将划分得到的第2个序列作为第2行,以此类推,将划分得到的第P个序列作为矩阵的第P行,从而得到一个P行Q列的矩阵,该矩阵为文本经过处理后的重构特征向量。
反卷积层1至反卷积层n用于对拆分层输出的文本的重构特征向量进行反卷积处理,得到文本的重构文本语义向量。具体的,反卷积层n对拆分层输出的文本的重构特征向量进行反卷积运算,得到运算结果,反卷积层n-1对反卷积层n的运算结果进行反卷积运算,得到运算结果,以此类推,每个反卷积层对前一个反卷积层的运算结果进行反卷积运算,反卷积层1的运算结果为文本的重构文本语义向量。需要说明的是,解码器12中用于对拆分层输出的文本的重构特征向量进行反卷积处理的反卷积层,与编码器11中用于对文本的文本语义向量进行卷积运算的卷积层的数量一致。
需要说明的是,上述情感分类模型中的解码器12仅在训练模型的过程中运行,在完成模型训练后,对目标文本中的目标分词进行情感极性预测过程中,解码器12是不运行的。
另外,在图2所示的情感分类模型中,用于对拆分层输出的文本的重构特征向量进行反卷积处理的反卷积层,以及用于对文本的文本语义向量进行卷积运算的卷积层,都为多个。在实施中,用于对拆分层输出的文本的重构特征向量进行反卷积处理的反卷积层,以及用于对文本的文本语义向量进行卷积运算的卷积层,也可以为1个。
另外,在图2所示的情感分类模型中,可以进一步设置用于对文本进行分词处理,获得多个分词的词向量,并基于多个分词的词向量生成文本的文本语义向量的结构。
需要说明的是,在对情感分类模型进行训练的过程中,将训练文本中需要进行情感极性预测的分词称为目标训练分词;在情感分类模型完成训练后,将目标文本中需要进行情感极性预测的分词称为目标分词。目标训练分词和目标分词均为名词。
对上述情感分类模型进行训练的方式有多种,下面分别结合图3和图4进行说明。
参见图3,图3为本申请实施例提供的一种情感分类模型的训练方法的流程图,包括如下步骤:
步骤S301:获得训练文本。
步骤S302:对训练文本进行分词处理,得到多个训练分词。
步骤S303:分别确定多个训练分词的词向量。
步骤S304:基于多个训练分词的词向量确定训练文本的文本语义向量。
其中,确定多个训练分词的词向量的过程,以及基于多个训练分词的词向量确定训练文本的文本语义向量的过程,请参见上文中的描述。
步骤S305:将训练文本的文本语义向量和训练文本中目标训练分词的词向量输入待训练的情感分类模型。
其中,情感分类模型的编码器用于对训练文本的文本语义向量进行卷积运算,得到训练文本的特征向量,对训练文本的特征向量和训练文本中目标训练分词的词向量进行运算,输出综合特征向量。情感分类模型的解码器用于对编码器输出的综合特征向量进行逆运算,输出训练文本的重构文本语义向量和训练文本中目标训练分词的重构词向量。编码器和解码器具体的数据处理过程,可以参见前文中的描述。
步骤S306:根据训练文本的文本语义向量和解码器输出的训练文本的重构文本语义向量确定语义向量重构误差,根据训练文本中目标训练分词的词向量和解码器输出的目标训练分词的重构词向量确定词向量重构误差。
训练文本的文本语义向量和重构文本语义向量均为一个M行N列的矩阵,训练文本中目标训练分词的词向量和重构词向量均为一个1行N列的矩阵,语义向量重构误差用于表征训练文本的文本语义向量和重构文本语义向量之间的差异大小,词向量重构误差用于表征训练文本中目标训练词的词向量和重构词向量之间的差异大小。
在一个可选的实施例中,将训练文本的文本语义向量和重构文本语义向量的平均绝对误差(Mean Absolute Error,MAE)确定为语义向量重构误差。文本语义向量和重构文本语义向量的MAE的计算公式如下:
在另一个可选的实施例中,将训练文本的文本语义向量和重构文本语义向量的和方差(Sum of Squares for Error,SSE)确定为语义向量重构误差。文本语义向量和重构文本语义向量的SSE的计算公式如下:
在另一个可选的实施例中,将训练文本的文本语义向量和重构文本语义向量的均方误差(Mean Square Error,MSE)确定为语义向量重构误差。文本语义向量和重构文本语义向量的MSE的计算公式如下:
在另一个可选的实施例中,将将训练文本的文本语义向量和重构文本语义向量的均方根误差(Root Mean Square Error,RMSE)确定为语义向量重构误差。文本语义向量和重构文本语义向量的RMSE的计算公式如下:
在上述公式1至公式4中,M为训练文本的文本语义向量和重构文本语义向量的行数,N为训练文本的文本语义向量和重构文本语义向量的列数,yi,j为训练文本的文本语义向量中位于第i行第j列的元素,为训练文本的重构文本语义向量中位于第i行第j列的元素,ωi,j为预设的权重。
在一个可选的实施例中,将训练文本中目标训练词的词向量和重构词向量的平均绝对误差确定为词向量重构误差。词向量和重构词向量的MAE的计算公式如下:
在一个可选的实施例中,将训练文本中目标训练次的词向量和重构词向量的和方差确定为词向量重构误差。词向量和重构词向量的SSE的计算公式如下:
在一个可选的实施例中,将训练文本中目标训练次的词向量和重构词向量的均方误差确定为词向量重构误差。词向量和重构词向量的MSE的计算公式如下:
在一个可选的实施例中,将训练文本中目标训练次的词向量和重构词向量的均方根误差确定为词向量重构误差。词向量和重构词向量的RMSE的计算公式如下:
在上述公式5至公式8中,N为训练文本中目标训练分词的词向量和重构词向量的列数,yj为训练文本中目标训练分词的词向量中位于第j列的元素,为训练文本中目标训练分词的重构词向量中位于第j列的元素,ωj为预设的权重。
步骤S307:根据语义向量重构误差和词向量重构误差确定待训练的情感分类模型的第一损失函数的输出值。
在一个可选的实施例中,第一损失函数如下:
L1=A1*Ls+A2*Lw (公式9)
其中,L1为第一损失函数,Ls为语义向量重构误差,Lw为词向量重构误差,A1和A2为预设的权重。
步骤S308:以最小化待训练的情感分类模型的第一损失函数的输出值为训练目标,更新待训练的情感分类模型的参数,直至第一损失函数的输出值小于或等于预设阈值。
利用大量的训练文本对情感分类模型进行训练,针对每一个训练文本,均执行上述的步骤S301至步骤S308,从而逐步优化情感分类模型的参数,直至针对训练文本得到的第一损失函数的输出值小于或等于预设阈值,完成情感分类模型的训练过程。
本申请上述实施例提供的训练情感分类模型的方法,编码器对输入的训练文本的文本语义向量和目标训练分词的词向量进行处理,得到包含文本语义特征和目标训练分词的特征的综合特征向量,解码器将编码器输出的综合特征向量作为输入,并对输入的综合特征向量进行逆处理,得到训练文本的重构文本语义向量和目标训练分词的重构词向量;之后,将训练文本的原始文本语义向量和重构文本语义向量之间的误差,以及目标训练分词的原始词向量和重构词向量之间的误差,作为依据来调整模型的参数,这使得模型能够对文本的语义信息和目标训练分词的信息进行深层的、非线性的、隐式的交互,从而保证完成训练的模型能够更好的捕捉文本的语义信息和目标分词的信息之间的复杂关系,从而使得对目标分词感情极性的识别更加准确。并且,由于编码器中的卷积层以及解码器中的反卷积层都具有并行处理的能力,因此能够很快完成模型的训练过程。
参见图4,图4为本申请实施例提供的另一种情感分类模型的训练方法的流程图,包括如下步骤:
步骤S401:获得训练文本,训练文本携带有目标训练分词的情感极性标注信息。
实施中,可以采用人工标注的方式,对训练文本中的目标训练分词标注情感极性。其中,训练文本中的目标训练分词为该训练文本中的名词。如果训练文本包括多个名词,那么针对多个名词分别标注对应的情感极性。
在一个可选的实施例中,针对目标训练分词标注的情感极性可以为积极、消极和中立。在另一个可选的实施例中,针对目标训练分词标注的情感极性可以为强烈支持、较为支持、中立、较为反对和强烈反对。在另一个可选的实施例中,针对目标训练分词标注的情感极性可以为非常喜欢、喜欢、无感、讨厌和非常讨厌。前述仅是部分举例,实施中还可以针对训练文本中的目标训练分词标注其他情感极性。
需要说明的是,针对训练文本中的虚词,不需要对其进行情感极性的标注。虚词是指没有完整意义,但有语法意义或者功能的词。虚词必须依附于实词或者语句。例如,汉语中的虚词主要包括副词、介词、助词、叹词和拟声词。
步骤S402:对训练文本进行分词处理,得到训练文本包含的多个训练分词。
步骤S403:分别确定多个训练分词的词向量。
步骤S404:基于多个训练分词的词向量确定训练文本的文本语义向量。
步骤S405:将训练文本的文本语义向量和训练文本中目标训练分词的词向量输入待训练的情感分类模型。
其中,情感分类模型的编码器用于对训练文本的文本语义向量进行卷积运算,得到训练文本的特征向量,对训练文本的特征向量和训练文本中目标训练分词的词向量进行运算,输出综合特征向量,情感分类模型的解码器用于对编码器输出的综合特征向量进行逆运算,输出训练文本的重构文本语义向量和训练文本中目标训练分词的重构词向量,分类器用于基于综合特征向量输出目标训练分词的情感极性预测结果。
步骤S406:根据训练文本的文本语义向量和解码器输出的训练文本的重构文本语义向量确定语义向量重构误差,根据训练文本中目标训练分词的词向量和解码器输出的目标训练分词的重构词向量确定词向量重构误差,根据目标训练分词的情感极性预测结果和目标训练分词的情感极性标注信息确定分类误差。
确定语义向量重构误差的方案以及确定词向量重构误差的方案,请参见前文中的描述,这里不再进行赘述。
在一个可选的实施例中,根据如下公式确定分类误差:
其中,Lc为分类误差;N为预设的情感极性的数量;yi为人工标注的该目标训练分词属于第i个情感极性的概率,其取值为0或1,yi的取值为1表示该目标训练分词的情感极性为第i个情感极性,yi的取值为0表示该目标训练分词的情感极性不为第i个情感极性;为情感分类模型输出的该目标训练分词属于第i个情感极性的概率,即是该目标训练词属于第i个情感极性的预测概率。
步骤S407:根据语义向量重构误差、词向量重构误差和分类误差确定待训练的情感分类模型的第二损失函数的输出值。
在一个可选的实施例中,第二损失函数如下:
L2=B1*Ls+B2*Lw+B3*Lc (公式11)
其中,L2为第二损失函数,Ls为语义向量重构误差,Lw为词向量重构误差,Lc为分类误差,B1、B2和B3为预设的权重。
步骤S408:以最小化待训练的情感分类模型的第二损失函数的输出值为训练目标,更新待训练的情感分类模型的参数,直至第二损失函数的输出值小于或等于预设阈值。
预先获得大量的训练文本,并对训练文本中的目标训练分词标注情感极性信息,针对每一个训练文本,均执行上述的步骤S401至步骤S408,从而逐步优化情感分类模型的参数,直至针对训练文本得到的第二损失函数的输出值小于或等于预设阈值,完成情感分类模型的训练过程。
本申请上述实施例提供的训练情感分类模型的方法,编码器对输入的训练文本的文本语义向量和目标训练分词的词向量进行处理,得到包含文本语义特征和目标训练分词的特征的综合特征向量,解码器将编码器输出的综合特征向量作为输入,并对输入的综合特征向量进行逆处理,得到训练文本的重构文本语义向量和目标训练分词的重构词向量,分类器对编码器器输出的综合特征向量进行分析,输出目标训练分词的情感极性预测结果;之后,将训练文本的原始文本语义向量和重构文本语义向量之间的误差,目标训练分词的原始词向量和重构词向量之间的误差,以及目标训练分词的情感极性预测结果与情感极性标注信息之间的误差,作为依据来调整模型的参数,这使得模型能够对文本的语义信息和目标训练分词的信息进行深层的、非线性的、隐式的交互,从而保证完成训练的模型能够更好的捕捉文本的语义信息和目标分词的信息之间的复杂关系,从而对目标分词感情极性的识别更加准确。并且,由于编码器中的卷积层以及解码器中的反卷积层都具有并行处理的能力,因此能够很快完成模型的训练过程。
下面结合图5,对本申请实施例提供的情感极性分析方法进行详细说明。
请参见图5,图5为本申请实施例提供的一种情感极性分析方法的流程图。具体包括:
步骤S501:获得情感分析请求。
其中,该情感分析请求携带有目标文本。该目标文本包括一个或者多个名词。该目标文本中的名词为需要进行情感极性分析的对象。
步骤S502:对目标文本进行分词处理,得到目标文本包含的多个分词。
步骤S503:分别确定多个分词的词向量。
步骤S504:基于多个分词的词向量确定目标文本的文本语义向量。
步骤S505:调用预先完成训练的情感分类模型。
步骤S506:基于情感分类模型对目标文本的文本语义向量和目标分词的词向量进行分析,确定目标分词的情感极性。
其中,目标分词为多个分词中的名词。以文本“餐厅的环境很好但是服务一般”为例,“环境”和“服务”可以作为目标分词。以文本“Good food but dreadful service atthan restaurant”为例,“food”和“service”可以作为目标分词。需要说明的是,在目标文本包括多个名词的情况下,每次仅对其中一个名词进行情感极性的预测。
在一个可选的实施例中,情感分析请求携带的目标文本中,标注了需要进行情感极性预测的分词,也就是说,情感分析请求携带有目标文本,以及该目标文本中目标分词的指示信息。
在一个可选的实施例中,情感分析请求未携带目标文本中目标分词的指示信息。在接收到情感分析请求时,对目标文本中的分词进行词性分析,确定目标文本中包含的名词,将各名词依次作为目标分词,并针对每次确定的目标分词进行情感极性预测,从而基于情感分析模型预测出目标文本中各名词的情感极性。
情感分类模型中的编码器11对目标文本的文本语义向量进行至少一次卷积运算,得到目标文本的特征向量,之后将目标文本的特征向量转换为单行矩阵,将转换得到的单行矩阵与目标分词的词向量进行拼接,之后将拼接得到的单行矩阵进行多次卷积运算,对经过多次卷积运算得到的运算结果进行处理,得到综合特征向量,该综合特征向量包含有目标文本的特征向量和目标分词的特征向量;分类器13将该综合特征向量作为输入,基于该综合特征向量输出目标分词的情感极性预测结果。
其中,分类器13输出的目标分词的情感极性预测结果为:目标分词属于多个预设情感极性的概率。
相应的,确定目标分词的情感极性,具体为:获得情感分类模型输出的目标分词属于多个预设情感极性的概率,将概率最高的情感极性确定为目标分词的情感极性。
在上述实施例提供的情感极性分析方法,首先对目标文本进行分词处理,得到目标文本包含的多个分词,之后分别确定多个分词的词向量,并根据多个分词的词向量确定目标文本的文本语义向量,之后利用预先完成训练的情感分类模型对目标文本的文本语义向量和目标分词的词向量进行分析,从而确定目标分词的情感极性。在对目标分词进行情感极性预测过程中所使用的情感分类模型,其编码器至少包括多个卷积层,其解码器至少包括多个反卷积层,并且对该模型进行训练过程中,所使用的训练依据至少包括训练文本的语义向量重构误差和词向量重构误差,这使得该模型能够更好的捕捉文本的语义信息和目标分词的信息之间的复杂关系,因此,针对文本中目标分词预测得到的情感极性具有更好的准确性和可靠性。
下面结合对餐厅进行多维度评价这一应用场景,对本申请提供的情感极性分析方法进行说明。
参见图6,图6为本申请实施例提供的在一个应用场景下的情感极性分析方法在下的信令图。该方法具体包括:
步骤S601:终端采集餐厅的评价数据。
终端可以在针对餐厅的评价页面中获取评价数据,每条评价数据作为一个文本。
步骤S602:终端对采集到的评价数据进行预处理。
终端对采集到的评价数据进行预处理,包括但不限于删除重复的评价、删除字数过少的评价。
字数过少的评价,其可参考价值往往较低,而且由于评价的字数较少,往往无法确定用户是在哪个方面对餐厅进行评价。例如,针对某个餐厅的评价,其内容为“好”,根据该评价无法确定是对餐厅的哪个维度(也可以理解为方面)进行评价,而且该评价中没有包含名词,也无需进行情感分析预测。因此,终端将采集到的文本中字数过少的文本删除。
对于内容重复的评价,如果都发送至服务器进行分析,会加重服务器的负担,因此仅保留其中的一条评价即可。
需要说明的是,在实施中,步骤S602是可以省略的。
步骤S603:终端向服务器发送情感分析请求,该情感分析请求携带有评价数据。
其中,情感分析请求携带的评价数据为经过预处理得到的评价数据的全部或者一部分。
步骤S604:服务器接收情感分析请求,获得情感分析请求携带的评价数据。
步骤S605:服务器对评价数据进行分词处理,得到该评价数据包含的多个分词。
步骤S606:服务器分别确定多个分词的词向量,并确定该评价数据的文本语义向量。
步骤S607:服务器确定目标分词。
在一种可能的实施方式中,终端发送的情感分析请求携带有评价数据、以及该评价数据中的目标分词的指示信息。服务器根据情感分析请求携带的目标分词的指示信息确定目标分词。如果目标分词有多个,那么针对每个目标分词分别执行后续的步骤S608,从而确定各个目标分词的情感极性。
在另一种可能的实施方式中,服务器对该评价数据包含的多个分词进行词性分析,确定该评价数据包含的名词,将该评价数据包含的名词作为目标分词。如果该评价数据包含多个名词,那么将多个名词均作为目标分词,针对每个目标分词分别执行后续的步骤S608,从而确定各个目标分词的情感极性。
步骤S608:服务器基于情感分类模型对该评价数据的文本语义向量和目标分词的词向量进行分析,确定目标分词的情感极性。
以评价数据“环境很好,但服务一般为例”,服务器对各个分词进行词性分析,确定该评价数据中包含两个名词“环境”和“服务”,服务器将分词“环境”和“服务”作为目标分词。服务器基于情感分类模型对该评价数据的文本语义向量和目标分词“环境”的词向量进行分析,确定目标分词“环境”的情感极性为“强烈支持”。服务器基于情感分类模型对该评价数据的文本语义向量和目标分词“服务”的词向量进行分析,确定目标分词“服务”的情感极性为“中立”。
步骤S609:服务器向终端发送指示信息,该指示信息用于指示评价数据中的目标分词及目标分词的情感极性信息。
步骤S610:终端接收指示信息,基于指示信息对餐厅在多个维度进行评价。
另一方面,本申请实施例还提供一种情感极性分析装置。
下面对本申请实施例提供的情感极性分析装置进行介绍。下文中描述的情感极性分析装置可认为是,电子设备为实现本发明实施例提供的情感极性分析方法所需设置的程序模块。下文中关于情感极性分析装置的描述,可与上文中关于情感极性分析方法的描述相互参照。
参见图7,图7为本申请实施例提供的一种情感极性分析装置的结构示意图。该装置包括:
请求获取单元701,用于获得情感分析请求,情感分析请求携带有目标文本。
文本处理单元702,用于对目标文本进行分词处理,得到目标文本包含的多个分词。
词向量确定单元703,用于分别确定多个分词的词向量。
文本语义向量确定单元704,用于基于多个分词的词向量确定目标文本的文本语义向量。
模型调用单元705,用于调用预先完成训练的情感分类模型。
情感极性分析单元706,用于基于情感分类模型对目标文本的文本语义向量和目标分词的词向量进行分析,确定目标分词的情感极性,其中,目标分词为多个分词中的名词。
情感分类模型包括编码器、解码器和分类器,编码器至少包括多个卷积层,解码器至少包括多个反卷积层,在情感分类模型的训练过程中,至少基于语义向量重构误差和词向量重构误差调整情感分类模型的参数,其中,语义向量重构误差基于训练文本的文本语义向量和解码器解码得到的重构文本语义向量确定,词向量重构误差基于训练文本中目标训练分词的词向量和解码器解码得到的目标训练分词的重构词向量确定。
在一个可选的实施例中,情感极性分析装置还包括第一模型训练单元。
第一模型训练单元用于:获得训练文本;对训练文本进行分词处理,得到训练文本包含的多个训练分词;分别确定多个训练分词的词向量;基于多个训练分词的词向量确定训练文本的文本语义向量;将训练文本的文本语义向量和训练文本中目标训练分词的词向量输入待训练的情感分类模型;其中,情感分类模型的编码器用于对训练文本的文本语义向量进行卷积运算,得到训练文本的特征向量,对训练文本的特征向量和训练文本中目标训练分词的词向量进行运算,输出综合特征向量,情感分类模型的解码器用于对编码器输出的综合特征向量进行逆运算,输出训练文本的重构文本语义向量和训练文本中目标训练分词的重构词向量;根据训练文本的文本语义向量和解码器输出的训练文本的重构文本语义向量确定语义向量重构误差,根据训练文本中目标训练分词的词向量和解码器输出的目标训练分词的重构词向量确定词向量重构误差;根据语义向量重构误差和词向量重构误差确定待训练的情感分类模型的第一损失函数的输出值;以最小化待训练的情感分类模型的第一损失函数的输出值为训练目标,更新待训练的情感分类模型的参数,直至第一损失函数的输出值小于或等于预设阈值。
在另一个可选的实施例中,情感极性分析装置还包括第二模型训练单元。
第二模型训练单元用于:获得训练文本,训练文本携带有目标训练分词的情感极性标注信息;对训练文本进行分词处理,得到训练文本包含的多个训练分词;分别确定多个训练分词的词向量;基于多个训练分词的词向量确定训练文本的文本语义向量;将训练文本的文本语义向量和训练文本中目标训练分词的词向量输入待训练的情感分类模型;其中,情感分类模型的编码器用于对训练文本的文本语义向量进行卷积运算,得到训练文本的特征向量,对训练文本的特征向量和训练文本中目标训练分词的词向量进行运算,输出综合特征向量,情感分类模型的解码器用于对编码器输出的综合特征向量进行逆运算,输出训练文本的重构文本语义向量和训练文本中目标训练分词的重构词向量,分类器用于基于综合特征向量输出目标训练分词的情感极性预测结果;根据训练文本的文本语义向量和解码器输出的训练文本的重构文本语义向量确定语义向量重构误差,根据训练文本中目标训练分词的词向量和解码器输出的目标训练分词的重构词向量确定词向量重构误差,根据目标训练分词的情感极性预测结果和目标训练分词的情感极性标注信息确定分类误差;根据语义向量重构误差、词向量重构误差和分类误差确定待训练的情感分类模型的第二损失函数的输出值;以最小化待训练的情感分类模型的第二损失函数的输出值为训练目标,更新待训练的情感分类模型的参数,直至第二损失函数的输出值小于或等于预设阈值。
在另一个可选的实施例中,情感极性分析单元706在确定目标分词的情感极性方面,用于:获得情感分类模型输出的目标分词属于多个预设情感极性的概率;将概率最高的情感极性确定为目标分词的情感极性。
另一方面,本申请实施例还提供一种电子设备。
参见图8,图8为本申请实施例提供的一种的电子设备的硬件结构图。该电子设备800可以包括处理器801和存储器802。
可选的,该终端还可以包括:通信接口803、输入单元804、显示器805和通信总线806。其中,处理器801、存储器802、通信接口803、输入单元804、显示器805均通过通信总线806完成相互间的通信。
在本申请实施例中,该处理器801可以为中央处理器(Central Processing Unit,CPU),特定应用集成电路,数字信号处理器、现成可编程门阵列或者其他可编程逻辑器件等。
该处理器801可以调用存储器802中存储的程序。
存储器802中用于存放一个或者一个以上程序,程序可以包括程序代码,所述程序代码包括计算机操作指令。在本申请实施例中,该存储器中至少存储有用于实现以下功能的程序:
获得情感分析请求,情感分析请求携带有目标文本;对目标文本进行分词处理,得到目标文本包含的多个分词;分别确定多个分词的词向量;基于多个分词的词向量确定目标文本的文本语义向量;调用预先完成训练的情感分类模型;基于情感分类模型对目标文本的文本语义向量和目标分词的词向量进行分析,确定目标分词的情感极性,其中,目标分词为多个分词中的名词。
其中,情感分类模型包括编码器、解码器和分类器,编码器至少包括多个卷积层,解码器至少包括多个反卷积层,在情感分类模型的训练过程中,至少基于语义向量重构误差和词向量重构误差调整情感分类模型的参数,其中,语义向量重构误差基于训练文本的文本语义向量和解码器解码得到的重构文本语义向量确定,词向量重构误差基于训练文本中目标训练分词的词向量和解码器解码得到的目标训练分词的重构词向量确定。
在一种可能的实现方式中,该存储器802可包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、以上所提到的程序等;存储数据区可存储根据计算机设备的使用过程中所创建的数据等。
此外,存储器802可以包括高速随机存取存储器,还可以包括非易失性存储器。
该通信接口803可以为通信模块的接口。
本申请该输入单元805,该输入单元可以包括感应触摸显示面板上的触摸事件的触摸感应单元、键盘等等。
该显示器804包括显示面板,如触摸显示面板等。
当然,图8所示的电子设备结构并不构成对本申请实施例中电子设备的限定,在实际应用中电子设备可以包括比图8所示的更多或更少的部件,或者组合某些部件。
另一方面,本申请实施例还提供一种存储介质,该存储介质中存储有计算机可执行指令,该计算机可执行指令被处理器加载并执行时,实现如上任意一个实施例中的情感极性分析方法。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种情感极性分析方法,其特征在于,包括:
获得情感分析请求,所述情感分析请求携带有目标文本;
对所述目标文本进行分词处理,得到所述目标文本包含的多个分词;
分别确定所述多个分词的词向量;
基于所述多个分词的词向量确定所述目标文本的文本语义向量;
调用预先完成训练的情感分类模型;
基于所述情感分类模型对所述目标文本的文本语义向量和目标分词的词向量进行分析,确定所述目标分词的情感极性,其中,所述目标分词为所述多个分词中的名词;
所述情感分类模型包括编码器、解码器和分类器,所述编码器至少包括多个卷积层,所述解码器至少包括多个反卷积层,在所述情感分类模型的训练过程中,至少基于语义向量重构误差和词向量重构误差调整所述情感分类模型的参数,其中,所述语义向量重构误差基于训练文本的文本语义向量和所述解码器解码得到的重构文本语义向量确定,所述词向量重构误差基于所述训练文本中目标训练分词的词向量和所述解码器解码得到的所述目标训练分词的重构词向量确定。
2.根据权利要求1所述的方法,其特征在于,所述情感分类模型的训练过程,包括:
获得训练文本;
对所述训练文本进行分词处理,得到所述训练文本包含的多个训练分词;
分别确定所述多个训练分词的词向量;
基于所述多个训练分词的词向量确定所述训练文本的文本语义向量;
将所述训练文本的文本语义向量和所述训练文本中目标训练分词的词向量输入待训练的情感分类模型;其中,所述情感分类模型的编码器用于对所述训练文本的文本语义向量进行卷积运算,得到所述训练文本的特征向量,对所述训练文本的特征向量和所述训练文本中目标训练分词的词向量进行运算,输出综合特征向量,所述情感分类模型的解码器用于对所述编码器输出的综合特征向量进行逆运算,输出所述训练文本的重构文本语义向量和所述训练文本中目标训练分词的重构词向量;
根据所述训练文本的文本语义向量和所述解码器输出的所述训练文本的重构文本语义向量确定语义向量重构误差,根据所述训练文本中目标训练分词的词向量和所述解码器输出的所述目标训练分词的重构词向量确定词向量重构误差;
根据所述语义向量重构误差和所述词向量重构误差确定所述待训练的情感分类模型的第一损失函数的输出值;
以最小化所述待训练的情感分类模型的第一损失函数的输出值为训练目标,更新所述待训练的情感分类模型的参数,直至所述第一损失函数的输出值小于或等于预设阈值。
3.根据权利要求1所述的方法,其特征在于,所述情感分类模型的训练过程,包括:
获得训练文本,所述训练文本携带有目标训练分词的情感极性标注信息;
对所述训练文本进行分词处理,得到所述训练文本包含的多个训练分词;
分别确定所述多个训练分词的词向量;
基于所述多个训练分词的词向量确定所述训练文本的文本语义向量;
将所述训练文本的文本语义向量和所述训练文本中目标训练分词的词向量输入待训练的情感分类模型;其中,所述情感分类模型的编码器用于对所述训练文本的文本语义向量进行卷积运算,得到所述训练文本的特征向量,对所述训练文本的特征向量和所述训练文本中目标训练分词的词向量进行运算,输出综合特征向量,所述情感分类模型的解码器用于对所述编码器输出的综合特征向量进行逆运算,输出所述训练文本的重构文本语义向量和所述训练文本中目标训练分词的重构词向量,所述分类器用于基于所述综合特征向量输出所述目标训练分词的情感极性预测结果;
根据所述训练文本的文本语义向量和所述解码器输出的所述训练文本的重构文本语义向量确定语义向量重构误差,根据所述训练文本中目标训练分词的词向量和所述解码器输出的所述目标训练分词的重构词向量确定词向量重构误差,根据所述目标训练分词的情感极性预测结果和所述目标训练分词的情感极性标注信息确定分类误差;
根据所述语义向量重构误差、所述词向量重构误差和所述分类误差确定所述待训练的情感分类模型的第二损失函数的输出值;
以最小化所述待训练的情感分类模型的第二损失函数的输出值为训练目标,更新所述待训练的情感分类模型的参数,直至所述第二损失函数的输出值小于或等于预设阈值。
4.根据权利要求1所述的方法,其特征在于,所述确定所述目标分词的情感极性,包括:
获得所述情感分类模型输出的所述目标分词属于多个预设情感极性的概率;将概率最高的情感极性确定为所述目标分词的情感极性。
5.一种情感极性分析装置,其特征在于,包括:
请求获取单元,用于获得情感分析请求,所述情感分析请求携带有目标文本;
文本处理单元,用于对所述目标文本进行分词处理,得到所述目标文本包含的多个分词;
词向量确定单元,用于分别确定所述多个分词的词向量;
文本语义向量确定单元,用于基于所述多个分词的词向量确定所述目标文本的文本语义向量;
模型调用单元,用于调用预先完成训练的情感分类模型;
情感极性分析单元,用于基于所述情感分类模型对所述目标文本的文本语义向量和目标分词的词向量进行分析,确定所述目标分词的情感极性,其中,所述目标分词为所述多个分词中的名词;
所述情感分类模型包括编码器、解码器和分类器,所述编码器至少包括多个卷积层,所述解码器至少包括多个反卷积层,在所述情感分类模型的训练过程中,至少基于语义向量重构误差和词向量重构误差调整所述情感分类模型的参数,其中,所述语义向量重构误差基于训练文本的文本语义向量和所述解码器解码得到的重构文本语义向量确定,所述词向量重构误差基于所述训练文本中目标训练分词的词向量和所述解码器解码得到的所述目标训练分词的重构词向量确定。
6.根据权利要求5所述的装置,其特征在于,还包括第一模型训练单元,所述第一模型训练单元用于:
获得训练文本;对所述训练文本进行分词处理,得到所述训练文本包含的多个训练分词;分别确定所述多个训练分词的词向量;基于所述多个训练分词的词向量确定所述训练文本的文本语义向量;将所述训练文本的文本语义向量和所述训练文本中目标训练分词的词向量输入待训练的情感分类模型;其中,所述情感分类模型的编码器用于对所述训练文本的文本语义向量进行卷积运算,得到所述训练文本的特征向量,对所述训练文本的特征向量和所述训练文本中目标训练分词的词向量进行运算,输出综合特征向量,所述情感分类模型的解码器用于对所述编码器输出的综合特征向量进行逆运算,输出所述训练文本的重构文本语义向量和所述训练文本中目标训练分词的重构词向量;根据所述训练文本的文本语义向量和所述解码器输出的所述训练文本的重构文本语义向量确定语义向量重构误差,根据所述训练文本中目标训练分词的词向量和所述解码器输出的所述目标训练分词的重构词向量确定词向量重构误差;根据所述语义向量重构误差和所述词向量重构误差确定所述待训练的情感分类模型的第一损失函数的输出值;以最小化所述待训练的情感分类模型的第一损失函数的输出值为训练目标,更新所述待训练的情感分类模型的参数,直至所述第一损失函数的输出值小于或等于预设阈值。
7.根据权利要求5所述的装置,其特征在于,还包括第二模型训练单元,所述第二模型训练单元用于:
获得训练文本,所述训练文本携带有目标训练分词的情感极性标注信息;对所述训练文本进行分词处理,得到所述训练文本包含的多个训练分词;分别确定所述多个训练分词的词向量;基于所述多个训练分词的词向量确定所述训练文本的文本语义向量;将所述训练文本的文本语义向量和所述训练文本中目标训练分词的词向量输入待训练的情感分类模型;其中,所述情感分类模型的编码器用于对所述训练文本的文本语义向量进行卷积运算,得到所述训练文本的特征向量,对所述训练文本的特征向量和所述训练文本中目标训练分词的词向量进行运算,输出综合特征向量,所述情感分类模型的解码器用于对所述编码器输出的综合特征向量进行逆运算,输出所述训练文本的重构文本语义向量和所述训练文本中目标训练分词的重构词向量,所述分类器用于基于所述综合特征向量输出所述目标训练分词的情感极性预测结果;根据所述训练文本的文本语义向量和所述解码器输出的所述训练文本的重构文本语义向量确定语义向量重构误差,根据所述训练文本中目标训练分词的词向量和所述解码器输出的所述目标训练分词的重构词向量确定词向量重构误差,根据所述目标训练分词的情感极性预测结果和所述目标训练分词的情感极性标注信息确定分类误差;根据所述语义向量重构误差、所述词向量重构误差和所述分类误差确定所述待训练的情感分类模型的第二损失函数的输出值;以最小化所述待训练的情感分类模型的第二损失函数的输出值为训练目标,更新所述待训练的情感分类模型的参数,直至所述第二损失函数的输出值小于或等于预设阈值。
8.根据权利要求5所述的装置,其特征在于,所述情感极性分析单元在确定所述目标分词的情感极性方面,用于:
获得所述情感分类模型输出的所述目标分词属于多个预设情感极性的概率;将概率最高的情感极性确定为所述目标分词的情感极性。
9.一种电子设备,其特征在于,包括处理器和存储器;
所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器用于存储所述程序,所述程序至少用于:
获得情感分析请求,所述情感分析请求携带有目标文本;
对所述目标文本进行分词处理,得到所述目标文本包含的多个分词;
分别确定所述多个分词的词向量;
基于所述多个分词的词向量确定所述目标文本的文本语义向量;
调用预先完成训练的情感分类模型;
基于所述情感分类模型对所述目标文本的文本语义向量和目标分词的词向量进行分析,确定所述目标分词的情感极性,其中,所述目标分词为所述多个分词中的名词;
所述情感分类模型包括编码器、解码器和分类器,所述编码器至少包括多个卷积层,所述解码器至少包括多个反卷积层,在所述情感分类模型的训练过程中,至少基于语义向量重构误差和词向量重构误差调整所述情感分类模型的参数,其中,所述语义向量重构误差基于训练文本的文本语义向量和所述解码器解码得到的重构文本语义向量确定,所述词向量重构误差基于所述训练文本中目标训练分词的词向量和所述解码器解码得到的所述目标训练分词的重构词向量确定。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令被处理器加载并执行时,实现如上权利要求1至4中任一项所述的情感极性分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910661998.2A CN110377740B (zh) | 2019-07-22 | 2019-07-22 | 情感极性分析方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910661998.2A CN110377740B (zh) | 2019-07-22 | 2019-07-22 | 情感极性分析方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110377740A true CN110377740A (zh) | 2019-10-25 |
CN110377740B CN110377740B (zh) | 2022-05-20 |
Family
ID=68254764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910661998.2A Active CN110377740B (zh) | 2019-07-22 | 2019-07-22 | 情感极性分析方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110377740B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110825849A (zh) * | 2019-11-05 | 2020-02-21 | 泰康保险集团股份有限公司 | 文本信息情感分析方法、装置、介质及电子设备 |
CN110889290A (zh) * | 2019-11-13 | 2020-03-17 | 北京邮电大学 | 文本编码方法和设备、文本编码有效性检验方法和设备 |
CN110929528A (zh) * | 2019-11-21 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 对语句情感分析的方法、装置、服务器及存储介质 |
CN111144507A (zh) * | 2019-12-30 | 2020-05-12 | 北京百度网讯科技有限公司 | 情感分析模型预训练方法、装置及电子设备 |
CN111143564A (zh) * | 2019-12-27 | 2020-05-12 | 北京百度网讯科技有限公司 | 无监督的多目标篇章级情感分类模型训练方法和装置 |
CN111144108A (zh) * | 2019-12-26 | 2020-05-12 | 北京百度网讯科技有限公司 | 情感倾向性分析模型的建模方法、装置和电子设备 |
CN111291187A (zh) * | 2020-01-22 | 2020-06-16 | 北京芯盾时代科技有限公司 | 一种情感分析方法、装置、电子设备及存储介质 |
CN111339255A (zh) * | 2020-02-26 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 目标情感分析的方法、模型训练方法、介质和设备 |
CN111930940A (zh) * | 2020-07-30 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 一种文本情感分类方法、装置、电子设备及存储介质 |
CN111930942A (zh) * | 2020-08-07 | 2020-11-13 | 腾讯云计算(长沙)有限责任公司 | 文本分类方法、语言模型训练方法、装置及设备 |
CN112307757A (zh) * | 2020-10-28 | 2021-02-02 | 中国平安人寿保险股份有限公司 | 基于辅助任务的情感分析方法、装置、设备及存储介质 |
CN112749275A (zh) * | 2020-05-22 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 一种数据处理方法以及设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160321243A1 (en) * | 2014-01-10 | 2016-11-03 | Cluep Inc. | Systems, devices, and methods for automatic detection of feelings in text |
CN106502989A (zh) * | 2016-10-31 | 2017-03-15 | 东软集团股份有限公司 | 情感分析方法及装置 |
CN107357899A (zh) * | 2017-07-14 | 2017-11-17 | 吉林大学 | 基于和积网络深度自动编码器的短文本情感分析方法 |
CN108388654A (zh) * | 2018-03-01 | 2018-08-10 | 合肥工业大学 | 一种基于转折句语义块划分机制的情感分类方法 |
CN109271627A (zh) * | 2018-09-03 | 2019-01-25 | 深圳市腾讯网络信息技术有限公司 | 文本分析方法、装置、计算机设备和存储介质 |
CN109543180A (zh) * | 2018-11-08 | 2019-03-29 | 中山大学 | 一种基于注意力机制的文本情感分析方法 |
WO2019072166A1 (zh) * | 2017-10-10 | 2019-04-18 | 腾讯科技(深圳)有限公司 | 语义分析方法、装置和存储介质 |
CN109815485A (zh) * | 2018-12-24 | 2019-05-28 | 厦门市美亚柏科信息股份有限公司 | 一种微博短文本情感极性识别的方法、装置及存储介质 |
CN109840561A (zh) * | 2019-01-25 | 2019-06-04 | 湘潭大学 | 一种可用于垃圾分类的垃圾图像自动生成方法 |
-
2019
- 2019-07-22 CN CN201910661998.2A patent/CN110377740B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160321243A1 (en) * | 2014-01-10 | 2016-11-03 | Cluep Inc. | Systems, devices, and methods for automatic detection of feelings in text |
CN106502989A (zh) * | 2016-10-31 | 2017-03-15 | 东软集团股份有限公司 | 情感分析方法及装置 |
CN107357899A (zh) * | 2017-07-14 | 2017-11-17 | 吉林大学 | 基于和积网络深度自动编码器的短文本情感分析方法 |
WO2019072166A1 (zh) * | 2017-10-10 | 2019-04-18 | 腾讯科技(深圳)有限公司 | 语义分析方法、装置和存储介质 |
CN108388654A (zh) * | 2018-03-01 | 2018-08-10 | 合肥工业大学 | 一种基于转折句语义块划分机制的情感分类方法 |
CN109271627A (zh) * | 2018-09-03 | 2019-01-25 | 深圳市腾讯网络信息技术有限公司 | 文本分析方法、装置、计算机设备和存储介质 |
CN109543180A (zh) * | 2018-11-08 | 2019-03-29 | 中山大学 | 一种基于注意力机制的文本情感分析方法 |
CN109815485A (zh) * | 2018-12-24 | 2019-05-28 | 厦门市美亚柏科信息股份有限公司 | 一种微博短文本情感极性识别的方法、装置及存储介质 |
CN109840561A (zh) * | 2019-01-25 | 2019-06-04 | 湘潭大学 | 一种可用于垃圾分类的垃圾图像自动生成方法 |
Non-Patent Citations (1)
Title |
---|
吴苑斌: "情感倾向分析中的结构化方法", 《中国优秀博硕士学位论文全文数据库(博士)》 * |
Cited By (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110825849A (zh) * | 2019-11-05 | 2020-02-21 | 泰康保险集团股份有限公司 | 文本信息情感分析方法、装置、介质及电子设备 |
CN110889290B (zh) * | 2019-11-13 | 2021-11-16 | 北京邮电大学 | 文本编码方法和设备、文本编码有效性检验方法和设备 |
CN110889290A (zh) * | 2019-11-13 | 2020-03-17 | 北京邮电大学 | 文本编码方法和设备、文本编码有效性检验方法和设备 |
CN110929528A (zh) * | 2019-11-21 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 对语句情感分析的方法、装置、服务器及存储介质 |
CN110929528B (zh) * | 2019-11-21 | 2023-09-05 | 腾讯科技(深圳)有限公司 | 对语句情感分析的方法、装置、服务器及存储介质 |
CN111144108A (zh) * | 2019-12-26 | 2020-05-12 | 北京百度网讯科技有限公司 | 情感倾向性分析模型的建模方法、装置和电子设备 |
CN111144108B (zh) * | 2019-12-26 | 2023-06-27 | 北京百度网讯科技有限公司 | 情感倾向性分析模型的建模方法、装置和电子设备 |
CN111143564A (zh) * | 2019-12-27 | 2020-05-12 | 北京百度网讯科技有限公司 | 无监督的多目标篇章级情感分类模型训练方法和装置 |
US11537792B2 (en) * | 2019-12-30 | 2022-12-27 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Pre-training method for sentiment analysis model, and electronic device |
KR102472708B1 (ko) | 2019-12-30 | 2022-11-30 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 감정 분석 모델을 사전 트레이닝하는 방법, 장치 및 전자 기기 |
CN111144507A (zh) * | 2019-12-30 | 2020-05-12 | 北京百度网讯科技有限公司 | 情感分析模型预训练方法、装置及电子设备 |
JP7149993B2 (ja) | 2019-12-30 | 2022-10-07 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 感情分析モデルの事前トレーニング方法、装置及び電子機器 |
US20210200949A1 (en) * | 2019-12-30 | 2021-07-01 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Pre-training method for sentiment analysis model, and electronic device |
KR20210086940A (ko) * | 2019-12-30 | 2021-07-09 | 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. | 감정 분석 모델을 사전 트레이닝하는 방법, 장치 및 전자 기기 |
JP2021111323A (ja) * | 2019-12-30 | 2021-08-02 | ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド | 感情分析モデルの事前トレーニング方法、装置及び電子機器 |
CN111291187A (zh) * | 2020-01-22 | 2020-06-16 | 北京芯盾时代科技有限公司 | 一种情感分析方法、装置、电子设备及存储介质 |
CN111291187B (zh) * | 2020-01-22 | 2023-08-08 | 北京芯盾时代科技有限公司 | 一种情感分析方法、装置、电子设备及存储介质 |
CN111339255A (zh) * | 2020-02-26 | 2020-06-26 | 腾讯科技(深圳)有限公司 | 目标情感分析的方法、模型训练方法、介质和设备 |
CN111339255B (zh) * | 2020-02-26 | 2023-04-18 | 腾讯科技(深圳)有限公司 | 目标情感分析的方法、模型训练方法、介质和设备 |
CN112749275A (zh) * | 2020-05-22 | 2021-05-04 | 腾讯科技(深圳)有限公司 | 一种数据处理方法以及设备 |
CN112749275B (zh) * | 2020-05-22 | 2024-05-14 | 腾讯科技(深圳)有限公司 | 一种数据处理方法以及设备 |
CN111930940A (zh) * | 2020-07-30 | 2020-11-13 | 腾讯科技(深圳)有限公司 | 一种文本情感分类方法、装置、电子设备及存储介质 |
CN111930940B (zh) * | 2020-07-30 | 2024-04-16 | 腾讯科技(深圳)有限公司 | 一种文本情感分类方法、装置、电子设备及存储介质 |
CN111930942A (zh) * | 2020-08-07 | 2020-11-13 | 腾讯云计算(长沙)有限责任公司 | 文本分类方法、语言模型训练方法、装置及设备 |
CN111930942B (zh) * | 2020-08-07 | 2023-08-15 | 腾讯云计算(长沙)有限责任公司 | 文本分类方法、语言模型训练方法、装置及设备 |
CN112307757B (zh) * | 2020-10-28 | 2023-07-28 | 中国平安人寿保险股份有限公司 | 基于辅助任务的情感分析方法、装置、设备及存储介质 |
CN112307757A (zh) * | 2020-10-28 | 2021-02-02 | 中国平安人寿保险股份有限公司 | 基于辅助任务的情感分析方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110377740B (zh) | 2022-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110377740A (zh) | 情感极性分析方法、装置、电子设备及存储介质 | |
US10650102B2 (en) | Method and apparatus for generating parallel text in same language | |
US10025980B2 (en) | Assisting people with understanding charts | |
CN109817246A (zh) | 情感识别模型的训练方法、情感识别方法、装置、设备及存储介质 | |
CN108335313A (zh) | 图像分割方法及装置 | |
US11699074B2 (en) | Training sequence generation neural networks using quality scores | |
US10223440B2 (en) | Question and answer system emulating people and clusters of blended people | |
CN107239574B (zh) | 一种智能问答系统知识-问题匹配的方法及装置 | |
CN110276023A (zh) | Poi变迁事件发现方法、装置、计算设备和介质 | |
CN108369664A (zh) | 调整神经网络的大小 | |
CN112183078B (zh) | 文本摘要确定方法和装置 | |
CN114911465B (zh) | 算子的生成方法、装置、设备以及存储介质 | |
CN110378346A (zh) | 建立文字识别模型的方法、装置、设备和计算机存储介质 | |
CN108875931A (zh) | 神经网络训练及图像处理方法、装置、系统 | |
CN112131322A (zh) | 时间序列分类方法及装置 | |
CN114781402A (zh) | 问诊意图识别方法、装置、电子设备及可读存储介质 | |
CN115374771A (zh) | 文本标签确定方法及装置 | |
CN110389999A (zh) | 一种信息抽取的方法、装置、存储介质及电子设备 | |
CN112489628B (zh) | 语音数据选择方法、装置、电子设备及存储介质 | |
CN116402166B (zh) | 一种预测模型的训练方法、装置、电子设备及存储介质 | |
CN113627160A (zh) | 文本纠错方法、装置、电子设备及存储介质 | |
CN107688600A (zh) | 知识点挖掘方法及装置 | |
CN109710939B (zh) | 用于确定主题的方法和装置 | |
CN114490965B (zh) | 问题处理方法、装置、电子设备和存储介质 | |
CN113762421B (zh) | 分类模型的训练方法、流量分析方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |