CN112307757A - 基于辅助任务的情感分析方法、装置、设备及存储介质 - Google Patents

基于辅助任务的情感分析方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112307757A
CN112307757A CN202011175410.1A CN202011175410A CN112307757A CN 112307757 A CN112307757 A CN 112307757A CN 202011175410 A CN202011175410 A CN 202011175410A CN 112307757 A CN112307757 A CN 112307757A
Authority
CN
China
Prior art keywords
text
training
auxiliary task
emotion
loss function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011175410.1A
Other languages
English (en)
Other versions
CN112307757B (zh
Inventor
李明凡
周凯捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202011175410.1A priority Critical patent/CN112307757B/zh
Publication of CN112307757A publication Critical patent/CN112307757A/zh
Application granted granted Critical
Publication of CN112307757B publication Critical patent/CN112307757B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例涉及人工智能技术领域,公开了基于辅助任务的情感分析方法、装置、设备及存储介质,该方法包括:从训练文本中提取包括文本属性和关键信息的特征信息;将训练文本、文本属性和关键信息输入指定的情感分析模型得到第一预测结果,并根据第一预测结果确定第一损失函数值;根据训练辅助任务信息和训练文本确定第二损失函数值;根据第一损失函数值和第二损失函数值训练指定的情感分析模型,得到引入辅助任务的情感分析模型;将待测试文本、辅助任务信息、待测试文本的特征信息输入引入辅助任务的情感分析模型,得到目标预测结果,以提高情感分析效果。本发明涉及区块链技术,上述目标预测结果可存储于区块链中。

Description

基于辅助任务的情感分析方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于辅助任务的情感分析方法、装置、设备及存储介质。
背景技术
Aspect情感分析(Aspect-Level Sentiment Analysis,Aspect-Based SentimentAnalysis)在许多自然语言处理的场景中都非常有用,Aspect级别的情感分析需要对相关语句进行精细的理解,捕捉到与Aspect相关的语义,并且排除可能的其它Aspect相关信息的干扰。
现有方法大多基于深度神经网络模型来实现对相关语句的理解,然而,深度神经网络模型非常容易过拟合,这使得深度神经网络模型的结构不能复杂,或者参数不能太多,这样就限制了模型的效果的提升,从而影响情感分析的效果。因此,如何提高情感分析的效果非常重要。
发明内容
本发明实施例提供了一种基于辅助任务的情感分析方法、装置、设备及存储介质,有助于提高情感分析的效果和准确性。
第一方面,本发明实施例提供了一种基于辅助任务的情感分析方法,所述方法包括:
获取训练集中的训练文本,并从所述训练文本中提取特征信息,所述特征信息包括文本属性和关键信息;
将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果,并根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值;
获取训练辅助任务信息,并根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果,以及根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值;
根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型;
获取待测试文本和辅助任务信息,并从所述待测试文本中提取特征信息,将所述待测试文本、所述辅助任务信息、所述特征信息输入所述引入辅助任务的情感分析模型,得到所述待测试文本针对所述特征信息的文本属性的情感类别的目标预测结果。
进一步地,所述将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果之前,还包括:
对所述训练文本进行预处理,所述预处理包括分词处理或规范化处理;
对所述预处理得到的训练文本进行数字化处理,以对所述训练文本中的各词添加数字标识,并对所述训练文本中的文本属性添加情感类别标签。
进一步地,所述将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果,包括:
将所述数字化处理的训练文本、所述添加情感类别标签的文本属性以及所述训练文本中的关键信息输入指定的情感分析模型中的理解模块,得到所述训练文本的理解表示和所述文本属性的理解表示;
将所述训练文本的理解表示、所述文本属性的理解表示以及所述关键信息输入所述指定的情感分析模型中的交互与分类模块,得到与所述文本属性对应的情感类别的情感概率分布。
进一步地,所述根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值,包括:
根据所述文本属性对应的情感类别的情感概率分布和所述文本属性的情感类别标签,计算得到情感分类的第一损失函数值。
进一步地,所述根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果,包括:
获取所述训练文本的理解表示;
将所述训练辅助任务信息、所述训练文本的理解表示和所述关键信息输入辅助任务模块,得到所述训练辅助任务信息对应的第二预测结果。
进一步地,所述训练辅助任务信息包括辅助任务标签;所述根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值,包括:
获取所述训练辅助任务信息中包括的辅助任务标签;
根据所述第二预测结果和所述辅助任务标签,确定所述训练辅助任务信息对应的第二损失函数值。
进一步地,所述根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型,包括:
将所述第一损失函数值和所述第二损失函数值进行加权求和得到目标损失函数值;
根据所述目标损失函数值训练所述指定的情感分析模型和所述辅助任务模块,得到引入辅助任务的情感分析模型。
第二方面,本发明实施例提供了一种基于辅助任务的情感分析装置,包括:
获取单元,用于获取训练集中的训练文本,并从所述训练文本中提取特征信息,所述特征信息包括文本属性和关键信息;
第一确定单元,用于将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果,并根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值;
第二确定单元,用于获取训练辅助任务信息,并根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果,以及根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值;
训练单元,用于根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型;
预测单元,用于获取待测试文本和辅助任务信息,并从所述待测试文本中提取特征信息,将所述待测试文本、所述辅助任务信息、所述特征信息输入所述引入辅助任务的情感分析模型,得到所述待测试文本针对所述特征信息的文本属性的情感类别的目标预测结果。
第三方面,本发明实施例提供了一种计算机设备,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储支持基于辅助任务的情感分析装置执行上述方法的计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行上述第一方面的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行以实现上述第一方面的方法。
本发明实施例可以获取训练集中的训练文本,并从训练文本中提取特征信息,特征信息包括文本属性和关键信息;将训练文本、文本属性以及关键信息输入指定的情感分析模型,得到与文本属性对应的情感类别的第一预测结果,并根据第一预测结果确定文本属性对应的情感类别的第一损失函数值;获取训练辅助任务信息,并根据训练辅助任务信息和训练文本确定训练辅助任务信息对应的第二预测结果,以及根据第二预测结果确定训练辅助任务信息对应的第二损失函数值;根据第一损失函数值和第二损失函数值训练指定的情感分析模型,得到引入辅助任务的情感分析模型;获取待测试文本和辅助任务信息,并从待测试文本中提取特征信息,将待测试文本、辅助任务信息、特征信息输入引入辅助任务的情感分析模型,得到待测试文本针对特征信息的文本属性的情感类别的目标预测结果。通过这种方式,可以提高情感分析的效果和准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于辅助任务的情感分析方法的示意流程图;
图2是本发明实施例提供的一种引入辅助任务的情感分析模型的架构图;
图3是本发明实施例提供的一种基于辅助任务的情感分析装置的示意框图;
图4是本发明实施例提供的一种计算机设备的示意框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的基于辅助任务的情感分析方法可以应用于一种基于辅助任务的情感分析装置,在某些实施例中,所述基于辅助任务的情感分析装置设置于计算机设备中。
下面结合附图1和附图2对本发明实施例提供的基于辅助任务的情感分析方法进行示意性说明。
请参见图1,图1是本发明实施例提供的一种基于辅助任务的情感分析方法的示意流程图,如图1所示,该方法可以由基于辅助任务的情感分析装置执行,所述基于辅助任务的情感分析装置设置于计算机设备中。具体地,本发明实施例的所述方法包括如下步骤。
S101:获取训练集中的训练文本,并从所述训练文本中提取特征信息,所述特征信息包括文本属性和关键信息。
本发明实施例中,基于辅助任务的情感分析装置可以获取训练集中的训练文本,并从所述训练文本中提取特征信息,所述特征信息包括文本属性和关键信息。在某些实施例中,所述关键信息包括如词性、NER结果等信息。
例如,假设训练文本为“Though the menu is limited,almost all of thedishes are excellent.”,则文本属性可以为menu和/或dishes。
S102:将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果,并根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值。
本发明实施例中,基于辅助任务的情感分析装置可以将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果,并根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值。在某些实施例中,所述第一预测结果包括所述文本属性的情感类别的概率分布。
在一个实施例中,基于辅助任务的情感分析装置在将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果之前,可以对所述训练文本进行预处理,所述预处理包括分词处理或规范化处理,并对所述预处理得到的训练文本进行数字化处理,以对所述训练文本中的各词添加数字标识,并对所述训练文本中的文本属性添加情感类别标签。
在一个实施例中,当训练文本满足预处理条件时,可以对训练进行进行预处理,其中,所述训练文本满足预处理条件包括但不限于所述训练文本包括特殊符号、空格等,其中,所述特殊符号包括但不限于列表符、换行符等。
在一个实施例中,当训练文本为由文字组成的文本时,可以对训练文本进行分词处理,得到由多个文本词组成的训练文本,并根据预设的一个词表对每一个文本词添加唯一的数字标识,以使每个文本词对应的数字标识不相同。
在一个实施例中,当训练文本为由字母组成的字母文本时,可以对字母文本进行规范化处理。在某些实施例中,所述规范化处理包括对标点符号、连音符、词根等的规范化处理。以对连音符进行规范化处理为例,假设字母文本为“I'm Li”,则可以将字母文本“I'mLi”规范化处理为“I'm Li”也就是将“I”和“'m”分开。然后根据预设的一个词表对每一个词添加唯一的数字标识。
在一个实施例中,基于辅助任务的情感分析装置在将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果时,可以将所述数字化处理的训练文本、所述添加情感类别标签的文本属性以及所述训练文本中的关键信息输入指定的情感分析模型中的理解模块,得到所述训练文本的理解表示和所述文本属性的理解表示,并将所述训练文本的理解表示、所述文本属性的理解表示以及所述关键信息输入所述指定的情感分析模型中的交互与分类模块,得到与所述文本属性对应的情感类别的情感概率分布。在某些实施例中,所述情感类别包括正向、负向、无倾向三种。
在一个实施例中,所述指定的情感分析模型中的理解模块可以通过卷积神经网络(Convolutional Neural Networks,CNN)或循环神经网络(Recurrent Neural Network,RNN)或注意力机制或全连接层等深度学习中的一些功能层来实现。在某些实施例中,所述文本属性的理解表示是数据张量。
在一个实施例中,所述指定的情感分析模型中的交互与分类模块,也可以通过CNN或RNN或注意力机制或全连接层等深度学习中的一些功能层来实现。
在一个实施例中,基于辅助任务的情感分析装置在根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值时,可以根据所述文本属性对应的情感类别的情感概率分布和所述文本属性的情感类别标签,计算得到情感分类的第一损失函数值。
S103:获取训练辅助任务信息,并根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果,以及根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值。
本发明实施例中,基于辅助任务的情感分析装置可以获取训练辅助任务信息,并根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果,以及根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值。
在一个实施例中,基于辅助任务的情感分析装置在根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果时,可以获取所述训练文本的理解表示,并将所述训练辅助任务信息、所述训练文本的理解表示和所述关键信息输入辅助任务模块,得到所述训练辅助任务信息对应的第二预测结果。
在一个实施例中,所述训练辅助任务信息包括辅助任务标签;基于辅助任务的情感分析装置在根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值时,可以获取所述训练辅助任务信息中包括的辅助任务标签,并根据所述第二预测结果和所述辅助任务标签,确定所述训练辅助任务信息对应的第二损失函数值。
S104:根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型。
本发明实施例中,基于辅助任务的情感分析装置可以根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型。
在一个实施例中,基于辅助任务的情感分析装置在根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型时,可以将所述第一损失函数值和所述第二损失函数值进行加权求和得到目标损失函数值,并根据所述目标损失函数值训练所述指定的情感分析模型和所述辅助任务模块,得到引入辅助任务的情感分析模型。
在一个实施例中,基于辅助任务的情感分析装置在将所述第一损失函数值和所述第二损失函数值进行加权求和得到目标损失函数值时,可以将所述第二损失函数值加入第一损失函数值中,以得到目标损失函数值。所述目标损失函数值的计算公式如下公式(1)所示:
L=L1+σL2(1)
其中,第一损失函数值的计算公式为:L1,第二损失函数值的计算公式为L2,σ为第二损失函数的权重。
在一个实施例中,所述引入辅助任务的情感分析模型的训练过程如图2所示,图2是本发明实施例提供的一种引入辅助任务的情感分析模型的架构图,如图2所示,将训练文本21、训练文本的文本属性以及关键信息22输入指定的情感分析模型23中的理解模块231中,得到文本属性的理解表示232和训练文本的理解表示233,将文本属性的理解表示232和训练文本的理解表示233输入交互与分类模块24,得到所述文本属性的情感类别的第一预测结果25,根据第一预测结果25确定第一损失函数值26。将所述训练辅助任务信息27、所述训练文本的理解表示233和关键信息输入辅助任务模块28,确定第二损失函数值209,以根据第一损失函数值26和第二损失函数值29确定目标损失函数值210,以根据目标损失函数值210训练模型得到引入辅助任务的情感分析模型。
S105:获取待测试文本和辅助任务信息,并从所述待测试文本中提取特征信息,将所述待测试文本、所述辅助任务信息、所述特征信息输入所述引入辅助任务的情感分析模型,得到所述待测试文本针对所述特征信息的文本属性的情感类别的目标预测结果。
本发明实施例中,基于辅助任务的情感分析装置可以获取待测试文本和辅助任务信息,并从所述待测试文本中提取特征信息,将所述待测试文本、所述辅助任务信息、所述特征信息输入所述引入辅助任务的情感分析模型,得到所述待测试文本针对所述特征信息的文本属性的情感类别的目标预测结果。
例如,假设待测试文本为“虽然菜品种类有限,但基本上每一样菜都非常好吃。”,该待测试文本为文字文本,则可以对该待测试文本进行分词处理得到:“虽然菜品种类有限,但基本上每一样菜都非常好吃。”,如果选取的文本属性为菜品种类,辅助任务为词性分析任务,则可以将待测试文本“虽然菜品种类有限,但基本上每一样菜都非常好吃。”,文本属性“菜品种类”以及词性分析任务的信息输入引入辅助任务的情感分析模型,输出情感分析结果和辅助任务的分析结果。其中,对文本属性“菜品种类”的评论为“有限”,如果情感分析结果对文本属性“菜品种类”的情感类别的概率分布是(0.02,0.38,0.6),则可以确定待测试文本中关于“菜品种类”的情感类别的描述有0.02的概率分布是正向的,0.38的概率分布是无倾向,0.6的概率分布是负向的。又例如,如果文本属性为“菜”,得到对文本属性“菜”的情感类别的概率分布是(0.9,0.09,0.01),则可以确定待测试文本中关于“菜”的情感倾向的描述有0.9的概率分布是正向的,0.09的概率分布是无倾向的,0.01的概率分布是负向的。辅助任务的分析结果为文本属性“菜”的词性为名词,文本属性“菜品种类”的词性为名词。
本发明实施例中,基于辅助任务的情感分析装置可以获取训练集中的训练文本,并从训练文本中提取特征信息,特征信息包括文本属性和关键信息;将训练文本、文本属性以及关键信息输入指定的情感分析模型,得到与文本属性对应的情感类别的第一预测结果,并根据第一预测结果确定文本属性对应的情感类别的第一损失函数值;获取训练辅助任务信息,并根据训练辅助任务信息和训练文本确定训练辅助任务信息对应的第二预测结果,以及根据第二预测结果确定训练辅助任务信息对应的第二损失函数值;根据第一损失函数值和第二损失函数值训练指定的情感分析模型,得到引入辅助任务的情感分析模型;获取待测试文本和辅助任务信息,并从待测试文本中提取特征信息,将待测试文本、辅助任务信息、特征信息输入引入辅助任务的情感分析模型,得到待测试文本针对特征信息的文本属性的情感类别的目标预测结果。通过这种方式,可以提高情感分析的效果和准确率。
本发明实施例还提供了一种基于辅助任务的情感分析装置,该基于辅助任务的情感分析装置用于执行前述任一项所述的方法的单元。具体地,参见图3,图3是本发明实施例提供的一种基于辅助任务的情感分析装置的示意框图。本实施例的基于辅助任务的情感分析装置包括:获取单元301、第一确定单元302、第二确定单元303、训练单元304以及预测单元305。
获取单元301,用于获取训练集中的训练文本,并从所述训练文本中提取特征信息,所述特征信息包括文本属性和关键信息;
第一确定单元302,用于将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果,并根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值;
第二确定单元303,用于获取训练辅助任务信息,并根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果,以及根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值;
训练单元304,用于根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型;
预测单元305,用于获取待测试文本和辅助任务信息,并从所述待测试文本中提取特征信息,将所述待测试文本、所述辅助任务信息、所述特征信息输入所述引入辅助任务的情感分析模型,得到所述待测试文本针对所述特征信息的文本属性的情感类别的目标预测结果。
进一步地,所述第一确定单元302将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果之前,还用于:
对所述训练文本进行预处理,所述预处理包括分词处理或规范化处理;
对所述预处理得到的训练文本进行数字化处理,以对所述训练文本中的各词添加数字标识,并对所述训练文本中的文本属性添加情感类别标签。
进一步地,所述第一确定单元302将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果时,具体用于:
将所述数字化处理的训练文本、所述添加情感类别标签的文本属性以及所述训练文本中的关键信息输入指定的情感分析模型中的理解模块,得到所述训练文本的理解表示和所述文本属性的理解表示;
将所述训练文本的理解表示、所述文本属性的理解表示以及所述关键信息输入所述指定的情感分析模型中的交互与分类模块,得到与所述文本属性对应的情感类别的情感概率分布。
进一步地,所述第一确定单元302根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值时,具体用于:
根据所述文本属性对应的情感类别的情感概率分布和所述文本属性的情感类别标签,计算得到情感分类的第一损失函数值。
进一步地,所述第二确定单元303根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果时,具体用于:
获取所述训练文本的理解表示;
将所述训练辅助任务信息、所述训练文本的理解表示和所述关键信息输入辅助任务模块,得到所述训练辅助任务信息对应的第二预测结果。
进一步地,所述训练辅助任务信息包括辅助任务标签;所述第二确定单元303根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值时,具体用于:
获取所述训练辅助任务信息中包括的辅助任务标签;
根据所述第二预测结果和所述辅助任务标签,确定所述训练辅助任务信息对应的第二损失函数值。
进一步地,所述训练单元304根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型时,具体用于:
将所述第一损失函数值和所述第二损失函数值进行加权求和得到目标损失函数值;
根据所述目标损失函数值训练所述指定的情感分析模型和所述辅助任务模块,得到引入辅助任务的情感分析模型。
本发明实施例中,基于辅助任务的情感分析装置可以获取训练集中的训练文本,并从训练文本中提取特征信息,特征信息包括文本属性和关键信息;将训练文本、文本属性以及关键信息输入指定的情感分析模型,得到与文本属性对应的情感类别的第一预测结果,并根据第一预测结果确定文本属性对应的情感类别的第一损失函数值;获取训练辅助任务信息,并根据训练辅助任务信息和训练文本确定训练辅助任务信息对应的第二预测结果,以及根据第二预测结果确定训练辅助任务信息对应的第二损失函数值;根据第一损失函数值和第二损失函数值训练指定的情感分析模型,得到引入辅助任务的情感分析模型;获取待测试文本和辅助任务信息,并从待测试文本中提取特征信息,将待测试文本、辅助任务信息、特征信息输入引入辅助任务的情感分析模型,得到待测试文本针对特征信息的文本属性的情感类别的目标预测结果。通过这种方式,可以提高情感分析的效果和准确率。
参见图4,图4是本发明实施例提供的一种计算机设备的示意框图。如图所示的本实施例中的设备可以包括:一个或多个处理器401;一个或多个输入设备402,一个或多个输出设备403和存储器404。上述处理器401、输入设备402、输出设备403和存储器404通过总线405连接。存储器404用于存储计算机程序,所述计算机程序包括程序,处理器401用于执行存储器404存储的程序。其中,处理器401被配置用于调用所述程序执行:
获取训练集中的训练文本,并从所述训练文本中提取特征信息,所述特征信息包括文本属性和关键信息;
将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果,并根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值;
获取训练辅助任务信息,并根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果,以及根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值;
根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型;
获取待测试文本和辅助任务信息,并从所述待测试文本中提取特征信息,将所述待测试文本、所述辅助任务信息、所述特征信息输入所述引入辅助任务的情感分析模型,得到所述待测试文本针对所述特征信息的文本属性的情感类别的目标预测结果。
进一步地,所述处理器401将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果之前,还用于:
对所述训练文本进行预处理,所述预处理包括分词处理或规范化处理;
对所述预处理得到的训练文本进行数字化处理,以对所述训练文本中的各词添加数字标识,并对所述训练文本中的文本属性添加情感类别标签。
进一步地,所述处理器401将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果时,具体用于:
将所述数字化处理的训练文本、所述添加情感类别标签的文本属性以及所述训练文本中的关键信息输入指定的情感分析模型中的理解模块,得到所述训练文本的理解表示和所述文本属性的理解表示;
将所述训练文本的理解表示、所述文本属性的理解表示以及所述关键信息输入所述指定的情感分析模型中的交互与分类模块,得到与所述文本属性对应的情感类别的情感概率分布。
进一步地,所述处理器401根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值时,具体用于:
根据所述文本属性对应的情感类别的情感概率分布和所述文本属性的情感类别标签,计算得到情感分类的第一损失函数值。
进一步地,所述处理器401根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果时,具体用于:
获取所述训练文本的理解表示;
将所述训练辅助任务信息、所述训练文本的理解表示和所述关键信息输入辅助任务模块,得到所述训练辅助任务信息对应的第二预测结果。
进一步地,所述训练辅助任务信息包括辅助任务标签;所述处理器401根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值时,具体用于:
获取所述训练辅助任务信息中包括的辅助任务标签;
根据所述第二预测结果和所述辅助任务标签,确定所述训练辅助任务信息对应的第二损失函数值。
进一步地,所述处理器401根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型时,具体用于:
将所述第一损失函数值和所述第二损失函数值进行加权求和得到目标损失函数值;
根据所述目标损失函数值训练所述指定的情感分析模型和所述辅助任务模块,得到引入辅助任务的情感分析模型。
本发明实施例中,计算机设备可以获取训练集中的训练文本,并从训练文本中提取特征信息,特征信息包括文本属性和关键信息;将训练文本、文本属性以及关键信息输入指定的情感分析模型,得到与文本属性对应的情感类别的第一预测结果,并根据第一预测结果确定文本属性对应的情感类别的第一损失函数值;获取训练辅助任务信息,并根据训练辅助任务信息和训练文本确定训练辅助任务信息对应的第二预测结果,以及根据第二预测结果确定训练辅助任务信息对应的第二损失函数值;根据第一损失函数值和第二损失函数值训练指定的情感分析模型,得到引入辅助任务的情感分析模型;获取待测试文本和辅助任务信息,并从待测试文本中提取特征信息,将待测试文本、辅助任务信息、特征信息输入引入辅助任务的情感分析模型,得到待测试文本针对特征信息的文本属性的情感类别的目标预测结果。通过这种方式,可以提高情感分析的效果和准确率。
应当理解,在本发明实施例中,所称处理器401可以是中央处理单元(CenSralProcessing UniS,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigiSalSignal Processor,DSP)、专用集成电路(ApplicaSion Specific InSegraSed CircuiS,ASIC)、现成可编程门阵列(Field-Programmable GaSe Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备402可以包括触控板、麦克风等,输出设备403可以包括显示器(LCD等)、扬声器等。
该存储器404可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器404的一部分还可以包括非易失性随机存取存储器。例如,存储器404还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的处理器401、输入设备402、输出设备403可执行本发明实施例提供的图1所述的方法实施例中所描述的实现方式,也可执行本发明实施例图3所描述的基于辅助任务的情感分析装置的实现方式,在此不再赘述。
本发明实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现图1所对应实施例中描述的基于辅助任务的情感分析方法,也可实现本发明图3所对应实施例的基于辅助任务的情感分析装置,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的基于辅助任务的情感分析装置的内部存储单元,例如基于辅助任务的情感分析装置的硬盘或内存。所述计算机可读存储介质也可以是所述基于辅助任务的情感分析装置的外部存储装置,例如所述基于辅助任务的情感分析装置上配备的插接式硬盘,智能存储卡(SmarS Media Card,SMC),安全数字(Secure DigiSal,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述基于辅助任务的情感分析装置的内部存储单元也包括外部存储装置。所述计算机可读存储介质用于存储所述计算机程序以及所述基于辅助任务的情感分析装置所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
需要强调的是,为进一步保证上述目标预测结果的私密和安全性,上述目标预测结果还可以存储于一区块链的节点中。其中,本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
以上所述,仅为本发明的部分实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于辅助任务的情感分析方法,其特征在于,所述方法包括:
获取训练集中的训练文本,并从所述训练文本中提取特征信息,所述特征信息包括文本属性和关键信息;
将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果,并根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值;
获取训练辅助任务信息,并根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果,以及根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值;
根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型;
获取待测试文本和辅助任务信息,并从所述待测试文本中提取特征信息,将所述待测试文本、所述辅助任务信息、所述特征信息输入所述引入辅助任务的情感分析模型,得到所述待测试文本针对所述特征信息的文本属性的情感类别的目标预测结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果之前,还包括:
对所述训练文本进行预处理,所述预处理包括分词处理或规范化处理;
对所述预处理得到的训练文本进行数字化处理,以对所述训练文本中的各词添加数字标识,并对所述训练文本中的文本属性添加情感类别标签。
3.根据权利要求2所述的方法,其特征在于,所述将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果,包括:
将所述数字化处理的训练文本、所述添加情感类别标签的文本属性以及所述训练文本中的关键信息输入指定的情感分析模型中的理解模块,得到所述训练文本的理解表示和所述文本属性的理解表示;
将所述训练文本的理解表示、所述文本属性的理解表示以及所述关键信息输入所述指定的情感分析模型中的交互与分类模块,得到与所述文本属性对应的情感类别的情感概率分布。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值,包括:
根据所述文本属性对应的情感类别的情感概率分布和所述文本属性的情感类别标签,计算得到情感分类的第一损失函数值。
5.根据权利要求3所述的方法,其特征在于,所述根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果,包括:
获取所述训练文本的理解表示;
将所述训练辅助任务信息、所述训练文本的理解表示和所述关键信息输入辅助任务模块,得到所述训练辅助任务信息对应的第二预测结果。
6.根据权利要求5所述的方法,其特征在于,所述训练辅助任务信息包括辅助任务标签;所述根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值,包括:
获取所述训练辅助任务信息中包括的辅助任务标签;
根据所述第二预测结果和所述辅助任务标签,确定所述训练辅助任务信息对应的第二损失函数值。
7.根据权利要求5所述的方法,其特征在于,所述根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型,包括:
将所述第一损失函数值和所述第二损失函数值进行加权求和得到目标损失函数值;
根据所述目标损失函数值训练所述指定的情感分析模型和所述辅助任务模块,得到引入辅助任务的情感分析模型。
8.一种基于辅助任务的情感分析装置,其特征在于,包括:
获取单元,用于获取训练集中的训练文本,并从所述训练文本中提取特征信息,所述特征信息包括文本属性和关键信息;
第一确定单元,用于将所述训练文本、所述文本属性以及所述关键信息输入指定的情感分析模型,得到与所述文本属性对应的情感类别的第一预测结果,并根据所述第一预测结果确定所述文本属性对应的情感类别的第一损失函数值;
第二确定单元,用于获取训练辅助任务信息,并根据所述训练辅助任务信息和所述训练文本确定所述训练辅助任务信息对应的第二预测结果,以及根据所述第二预测结果确定所述训练辅助任务信息对应的第二损失函数值;
训练单元,用于根据所述第一损失函数值和所述第二损失函数值训练所述指定的情感分析模型,得到引入辅助任务的情感分析模型;
预测单元,用于获取待测试文本和辅助任务信息,并从所述待测试文本中提取特征信息,将所述待测试文本、所述辅助任务信息、所述特征信息输入所述引入辅助任务的情感分析模型,得到所述待测试文本针对所述特征信息的文本属性的情感类别的目标预测结果。
9.一种计算机设备,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序,所述处理器被配置用于调用所述程序,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1-7任一项所述的方法。
CN202011175410.1A 2020-10-28 2020-10-28 基于辅助任务的情感分析方法、装置、设备及存储介质 Active CN112307757B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011175410.1A CN112307757B (zh) 2020-10-28 2020-10-28 基于辅助任务的情感分析方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011175410.1A CN112307757B (zh) 2020-10-28 2020-10-28 基于辅助任务的情感分析方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112307757A true CN112307757A (zh) 2021-02-02
CN112307757B CN112307757B (zh) 2023-07-28

Family

ID=74331815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011175410.1A Active CN112307757B (zh) 2020-10-28 2020-10-28 基于辅助任务的情感分析方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112307757B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113076753A (zh) * 2021-03-03 2021-07-06 山东英信计算机技术有限公司 一种情感分析模型训练优化方法、系统和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886580A (zh) * 2017-01-23 2017-06-23 北京工业大学 一种基于深度学习的图片情感极性分析方法
CN108804412A (zh) * 2018-04-13 2018-11-13 中国科学院自动化研究所 基于社会媒体的多层级情感分析方法
WO2019154411A1 (zh) * 2018-02-12 2019-08-15 腾讯科技(深圳)有限公司 词向量更新方法和装置
CN110377740A (zh) * 2019-07-22 2019-10-25 腾讯科技(深圳)有限公司 情感极性分析方法、装置、电子设备及存储介质
CN111079409A (zh) * 2019-12-16 2020-04-28 东北大学秦皇岛分校 一种利用上下文和方面记忆信息的情感分类方法
CN111125360A (zh) * 2019-12-19 2020-05-08 网易(杭州)网络有限公司 游戏领域的情感分析方法、装置及其模型训练方法、装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886580A (zh) * 2017-01-23 2017-06-23 北京工业大学 一种基于深度学习的图片情感极性分析方法
WO2019154411A1 (zh) * 2018-02-12 2019-08-15 腾讯科技(深圳)有限公司 词向量更新方法和装置
CN108804412A (zh) * 2018-04-13 2018-11-13 中国科学院自动化研究所 基于社会媒体的多层级情感分析方法
CN110377740A (zh) * 2019-07-22 2019-10-25 腾讯科技(深圳)有限公司 情感极性分析方法、装置、电子设备及存储介质
CN111079409A (zh) * 2019-12-16 2020-04-28 东北大学秦皇岛分校 一种利用上下文和方面记忆信息的情感分类方法
CN111125360A (zh) * 2019-12-19 2020-05-08 网易(杭州)网络有限公司 游戏领域的情感分析方法、装置及其模型训练方法、装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113076753A (zh) * 2021-03-03 2021-07-06 山东英信计算机技术有限公司 一种情感分析模型训练优化方法、系统和存储介质

Also Published As

Publication number Publication date
CN112307757B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN110163478B (zh) 一种合同条款的风险审查方法及装置
CN112860841A (zh) 一种文本情感分析方法、装置、设备及存储介质
CN112686036B (zh) 风险文本识别方法、装置、计算机设备及存储介质
Altheneyan et al. Big data ML-based fake news detection using distributed learning
CN113807103B (zh) 基于人工智能的招聘方法、装置、设备及存储介质
CN112732910B (zh) 跨任务文本情绪状态评估方法、系统、装置及介质
CN113704410B (zh) 情绪波动检测方法、装置、电子设备及存储介质
CN113707299A (zh) 基于问诊会话的辅助诊断方法、装置及计算机设备
CN112395391B (zh) 概念图谱构建方法、装置、计算机设备及存储介质
CN112100374A (zh) 文本聚类方法、装置、电子设备及存储介质
CN111178701B (zh) 一种基于特征衍生技术的风险控制方法方法、装置和电子设备
CN113626576A (zh) 远程监督中关系特征抽取方法、装置、终端及存储介质
CN116956896A (zh) 基于人工智能的文本分析方法、系统、电子设备及介质
CN117454142B (zh) 数据生成方法、装置、存储介质以及电子设备
Capistrano et al. SALSA: detection of cybertrolls using sentiment, aggression, lexical and syntactic analysis of tweets
CN118093015A (zh) 一种代码审查方法、装置、电子设备及存储介质
CN112307757B (zh) 基于辅助任务的情感分析方法、装置、设备及存储介质
CN113808616A (zh) 语音合规检测方法、装置、设备及存储介质
CN112364136A (zh) 关键词生成方法、装置、设备及存储介质
CN107688594B (zh) 基于社交信息的风险事件的识别系统及方法
CN113420143A (zh) 文书摘要生成方法、装置、设备及存储介质
CN113780580B (zh) 基于机器学习的数据分析方法、装置、设备及存储介质
CN113836297B (zh) 文本情感分析模型的训练方法及装置
CN113590786A (zh) 一种数据预测方法、装置、设备及存储介质
CN114492446A (zh) 法律文书处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant