CN115169345A - 文本情感分析模型的训练方法、装置、设备及存储介质 - Google Patents
文本情感分析模型的训练方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115169345A CN115169345A CN202210882802.4A CN202210882802A CN115169345A CN 115169345 A CN115169345 A CN 115169345A CN 202210882802 A CN202210882802 A CN 202210882802A CN 115169345 A CN115169345 A CN 115169345A
- Authority
- CN
- China
- Prior art keywords
- sentence
- word
- vector
- analysis model
- emotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
本申请公开一种文本情感分析模型的训练方法、装置、设备及存储介质,涉及语言处理技术领域,利用该训练方法训练得到的模型在进行文本情感分类时,能够提高文本情感分类的准确。具体方案包括:获取目标文本,以及目标文本中各句子的实际情感类型;确定各句子中各词的字向量和位置向量,字向量用于指示词的内容信息,位置向量用于指示词在句子中的位置信息;根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的预测情感类型;根据各句子的第一标签和第二标签,对情感分析模型进行训练,直至各句子的第一标签与第二标签满足第一预设条件为止,得到目标情感分析模型。
Description
技术领域
本申请涉及语言处理技术领域,尤其涉及一种文本情感分析模型的训练方法、装置、设备及存储介质。
背景技术
文本情感分析是自然语言处理领域的一个重要分支,广泛应用于舆情分析和内容推荐等方面,是近年来的研究热点。文本情感分析除了可以对安全信息进行等级分类之外,在其他领域也应用广泛,例如,在舆情分析方面,通过对热点事件进行情感剖析,寻找情感原因,了解公众意愿并预防危害事件的发生具有一定的意义。以及在情感对话方面,情感机器人可以抚慰心灵,充当情感陪护的角色等等。
目前的文本情感分析模型通过大量有标注的或无标注的样本,使用机器学习算法抽取特征后对模型进行训练,最后再利用训练好的模型进行情感分析输出结果。这种模型训练方法在对文本内容进行情感分析时常常不能充分利用上下文文本的语境信息,存在忽略上下文语义的问题,因此利用这种模型训练方法训练得到的模型在进行文本情感分类时,存在分类准确性较低的问题。
发明内容
本申请提供一种文本情感分析模型的训练方法、装置、设备及存储介质,利用该训练方法训练得到的模型在进行文本情感分类时,能够提高文本情感分类的准确性。
为达到上述目的,本申请采用如下技术方案:
本申请实施例第一方面,提供一种文本情感分析模型的训练方法,该方法包括:
获取目标文本,并获取目标文本包括的多个句子中各句子的第一标签,第一标签用于指示句子的实际情感类型;
确定各句子中各词的字向量和位置向量,字向量用于指示词的内容信息,位置向量用于指示词在句子中的位置信息;
根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的第二标签,第二标签用于指示句子的预测情感类型;
根据各句子的第一标签和第二标签,对情感分析模型进行训练,直至各句子的第一标签与第二标签满足第一预设条件为止,得到目标情感分析模型。
在一个实施中,根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的第二标签,包括:
根据各句子中各词的字向量和位置向量以及情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的特征向量;
根据各句子的特征向量对各句子进行情感分类,得到各句子的第二标签。
在一个实施中,获取目标文本之前,方法还包括:
获取参考文本,并确定参考文本中各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量,参考字向量用于指示参考词的内容信息,参考位置向量用于指示参考词在参考句子中的位置信息,参考文本向量用于指示参考词对应的参考句子的内容信息;
根据各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量对预设的初始情感分析模型进行训练,直至初始情感分析模型收敛,得到情感分析模型。
在一个实施中,根据各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量对预设的初始情感分析模型进行训练,直至初始情感分析模型收敛,得到情感分析模型,包括:
根据各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量,确定各参考句子中各参考词的参考词向量;
将各参考句子包括的参考词向量输入至初始情感分析模型中,进行语义关联的编码处理,得到各参考句子的句子向量;
将各句子向量输入至初始情感分析模型中进行解码处理,得到各句子向量解码后的各参考词的解码字向量、解码位置向量和解码文本向量;
将各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量作为真实解码标签,将各参考句子中各参考词的解码字向量、解码位置向量和解码文本向量作为预测解码标签;
根据真实解码标签和预测解码标签对初始情感分析模型进行训练,直至初始情感分析模型收敛,得到情感分析模型。
在一个实施中,根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的第二标签,包括:
将各句子中各词的字向量和位置向量输入至初始情感分析模型中,对各句子中的词之间的语义相关性进行分析处理,得到各句子中各词对应的词向量;
将各句子中各词对应的词向量输入至预设的长短期记忆模型中进行特征提取,得到各句子的特征向量;
根据各句子的特征向量对各句子进行情感分类,得到各句子的第二标签。
在一个实施中,根据各句子的特征向量对各句子进行情感分类,得到各句子的第二标签,包括:
将各句子的特征向量输入至预设的全连接神经网络线性分类层中进行分类处理,得到各句子对于不同情感类型的结果值;
将各句子对于不同情感类型的结果值进行归一化处理,得到各句子对于不同情感类型的预测分类概率;
对于各句子,根据句子对于不同情感类型的预测分类概率确定各句子的第二标签。
在一个实施中,第一标签还包括实际情感类型的实际概率,预设条件包括:
各句子实际情感类型对应的实际概率与实际情感类型对应的预测分类概率之间的概率差值的绝对值小于预设阈值。
本申请实施例第二方面,提供一种文本情感分析模型的训练装置,该装置包括:
获取模块,用于获取目标文本,并获取目标文本包括的多个句子中各句子的第一标签,第一标签用于指示句子的实际情感类型;
确定模块,用于确定各句子中各词的字向量和位置向量,字向量用于指示词的内容信息,位置向量用于指示词在句子中的位置信息;
处理模块,用于根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的第二标签,第二标签用于指示句子的预测情感类型;
训练模块,用于根据各句子的第一标签和第二标签,对情感分析模型进行训练,直至各句子的第一标签与第二标签满足第一预设条件为止,得到目标情感分析模型。
本申请实施例第三方面,提供一种计算机设备,该设备包括:存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时实现本申请实施例第一方面中的文本情感分析模型的训练方法。
本申请实施例第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本申请实施例第一方面中的的文本情感分析模型的训练方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
本申请实施例提供的文本情感分析模型的训练方法,通过获取目标文本,并获取目标文本包括的多个句子中各句子的第一标签,第一标签用于指示句子的实际情感类型,并确定各句子中各词的字向量和位置向量,字向量用于指示词的内容信息,位置向量用于指示词在句子中的位置信息,然后,根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的第二标签,第二标签用于指示句子的预测情感类型,最后,根据各句子的第一标签和第二标签,对情感分析模型进行训练,直至各句子的第一标签与第二标签满足第一预设条件为止,得到目标情感分析模型。本申请是根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理后得到预测情感类型,预测情感类型的得到考虑了词之间的语义相关性,因此通过该训练方法得到的模型,在进行文本情感分类时可以提高分类的准确性。
附图说明
图1为本申请实施例提供的一种计算机设备的内部结构示意图;
图2为本申请实施例提供的一种文本情感分析模型的训练方法流程图一;
图3为本申请实施例提供的一种文本情感分析模型的训练方法流程图二;
图4为本申请实施例提供的一种文本情感分析模型的训练装置的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本公开实施例的描述中,除非另有说明,“多个”的含义是两个或两个以上。
另外,“基于”或“根据”的使用意味着开放和包容性,因为“基于”或“根据”一个或多个条件或值的过程、步骤、计算或其他动作在实践中可以基于额外条件或超出的值。
文本情感分析是自然语言处理领域的一个重要分支,广泛应用于舆情分析和内容推荐等方面,是近年来的研究热点。文本情感分析除了可以对安全信息进行等级分类之外,在其他领域也应用广泛,例如,在舆情分析方面,通过对热点事件进行情感剖析,寻找情感原因,了解公众意愿并预防危害事件的发生具有一定的意义。以及在情感对话方面,情感机器人可以抚慰心灵,充当情感陪护的角色等等。
目前的文本情感分析模型通过大量有标注的或无标注的样本,使用机器学习算法抽取特征后对模型进行训练,最后再利用训练好的模型进行情感分析输出结果。这种模型训练方法在对文本内容进行情感分析时常常不能充分利用上下文文本的语境信息,存在忽略上下文语义的问题,因此利用这种模型训练方法训练得到的模型在进行文本情感分类时,存在分类准确性较低的问题。
为了解决上述问题,本申请实施例提供了一种文本情感分析模型的训练方法,通过获取目标文本,并获取目标文本包括的多个句子中各句子的第一标签,第一标签用于指示句子的实际情感类型,并确定各句子中各词的字向量和位置向量,字向量用于指示词的内容信息,位置向量用于指示词在句子中的位置信息,然后,根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的第二标签,第二标签用于指示句子的预测情感类型,最后,根据各句子的第一标签和第二标签,对情感分析模型进行训练,直至各句子的第一标签与第二标签满足第一预设条件为止,得到目标情感分析模型。本申请是根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理后得到预测情感类型,预测情感类型的得到考虑了词之间的语义相关性,因此通过该训练方法得到的模型,在进行文本情感分类时可以提高分类的准确性。
本申请实施例提供的文本情感分析模型的训练方法的执行主体可以为计算机设备、终端设备,或者服务器,其中,终端设备可以为各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等,本申请对比不作具体限定。
图1为本申请实施例提供的一种计算机设备的内部结构示意图。如图1所示,该计算机设备包括通过系统总线连接的处理器和存储器。其中,该处理器用于提供计算和控制能力。存储器可包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以上各个实施例提供的一种文本情感分析模型的训练方法的步骤。内存储器为非易失性存储介质中的操作系统和计算机程序提供高速缓存的运行环境。
本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
基于上述执行主体,本申请实施例提供一种文本情感分析模型的训练方法。如图2所示,该方法包括以下步骤:
步骤201、获取目标文本,并获取目标文本包括的多个句子中各句子的第一标签。
其中,目标文本中包括多个句子,各句子中包括多个词。第一标签用于指示句子的实际情感类型。示例的,文本的情感类型可以为消极的或积极的,同时,对于文本的情感类型还可以根据需求将细分为多个不同的情感类型,对此本申请不作具体限定。
需要说明的是,目标文本所属的领域与要进行文本情感分类的文本的领域相同。示例的,当需要对娱乐领域的文本进行情感分类时,目标文本也应是娱乐领域的文本;当需要对体育领域的文本进行情感分类时,目标文本也应是体育领域的文本。
步骤202、确定各句子中各词的字向量和位置向量。
其中,字向量用于指示词的内容信息,位置向量用于指示词在句子中的位置信息。
需要说明的是,在确定各句子中各词的字向量和位置向量之前,还需要对各句子中包括的文字进行分词处理,得各句子中的词,然后生成各词对应的字向量和位置向量,字向量用于指示词的内容信息,位置向量用于指示词在句子中的位置信息。
步骤203、根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的第二标签。
将各句子中各词的字向量和位置向量输入中预设的情感分析模型中,利用情感分析模型对各句子中的词之间的语义相关性进行分析处理,可以得到各个句子的第二标签,其中,第二标签用于指示句子的预测情感类型。
步骤204、根据各句子的第一标签和第二标签,对情感分析模型进行训练,直至各句子的第一标签与第二标签满足第一预设条件为止,得到目标情感分析模型。
其中,第一标签包括实际情感类型的实际概率,第二标签是根据句子对于不同情感类型的预测分类概率确定的。因此,上述预设条件可以为:各句子实际情感类型对应的实际概率与实际情感类型对应的预测分类概率之间的概率差值的绝对值小于预设阈值。也就是说,实际概率可以设定为1,当模型预测得到实际情感类型对应的预测分类概率无限接近1时,则可以得到目标情感分析模型。
可选的,上述情感分析模型可以为预训练的语言表征模型(BERT,BidirectionalEncoder Representation from Transformers),BERT模型通过查询字向量表将文本中的每个字转换为一维向量,作为模型输入。模型输出则是输入各字对应的融合全文语义信息后的向量表示。此外,模型输入除了字向量,还包含文本向量和位置向量。其中,文本向量,该向量的取值在模型训练过程中自动学习,用于刻画文本的全局语义信息,并与单字/词的语义信息相融合。位置向量,由于出现在文本不同位置的字/词所携带的语义信息存在差异,例如:“我爱你”和“你爱我”,因此,BERT模型对不同位置的字/词分别附加一个不同的向量以作区分。最后,BERT模型将字向量、文本向量和位置向量的加和作为模型输入。
本申请实施例提供的文本情感分析模型的训练方法,通过获取目标文本,并获取目标文本包括的多个句子中各句子的第一标签,第一标签用于指示句子的实际情感类型,并确定各句子中各词的字向量和位置向量,字向量用于指示词的内容信息,位置向量用于指示词在句子中的位置信息,然后,根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的第二标签,第二标签用于指示句子的预测情感类型,最后,根据各句子的第一标签和第二标签,对情感分析模型进行训练,直至各句子的第一标签与第二标签满足第一预设条件为止,得到目标情感分析模型。本申请是根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理后得到预测情感类型,预测情感类型的得到考虑了词之间的语义相关性,因此通过该训练方法得到的模型,在进行文本情感分类时可以提高分类的准确性。
如图3所示,在步骤201、获取目标文本之前,方法还包括:
步骤301、获取参考文本,并确定参考文本中各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量。
其中,参考字向量用于指示参考词的内容信息,参考位置向量用于指示参考词在参考句子中的位置信息,参考文本向量用于指示参考词对应的参考句子的内容信息。
步骤302、根据各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量对预设的初始情感分析模型进行训练,直至初始情感分析模型收敛,得到情感分析模型。
其中,参考文本可以为任一领域的文本信息,该参考文本的所属领域可以与进行情感分类的文本领域相同或者不同,本申请实施例对此不作限定。
可以理解的是,在获取目标文本之前,可以利用参考文本来对预设的初始情感分析模型进行训练,该训练过程可以理解为初始情感分析模型的预训练阶段。通过利用参考文本来对初始模型进行预训练可以提高模型后续的分类精度,同时可以解决由于目标文本数据量较少导致模型的分类精度不高的问题。
具体的,上述步骤302、根据各参考句子中各参考词的参考字向量和参考位置向量对预设的初始情感分析模型进行训练,直至初始情感分析模型收敛,得到情感分析模型的过程可以为:
根据各参考词的参考字向量、参考位置向量和参考文本向量,确定各参考句子中各参考词的参考词向量,并将各参考句子的参考词向量输入至初始情感分析模型中,进行语义关联的编码处理,得到各参考句子的句子向量。然后将各句子向量输入至初始情感分析模型中进行解码处理,得到各句子向量解码后的各参考词的解码字向量、解码位置向量和解码文本向量,以及将各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量作为真实解码标签,将各参考句子中各参考词的解码字向量、解码位置向量和解码文本向量作为预测解码标签。最后,根据真实解码标签和预测解码标签对初始情感分析模型进行训练,直至初始情感分析模型收敛,得到情感分析模型。
通过上述模型的预训练方式对初始情感分析模型进行训练可以得到情感分析模型,然后对该情感分析模型再进行微调训练,可以提高该情感分析模型的模型分类精度。
可选的,上述步骤203根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的第二标签的过程可以包括两种实现方式。
在第一种实现方式中,根据各句子中各词的字向量和位置向量以及情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的特征向量。然后,根据各句子的特征向量对各句子进行情感分类,得到各句子的第二标签。这种实现方式中,步骤203中的预设的情感分析模型为上述步骤302中训练得到的模型。
在第二种实现方式中,可以将各句子中各词的字向量和位置向量输入至初始情感分析模型中,对各句子中的词之间的语义相关性进行分析处理,得到各句子中各词对应的词向量。然后,将各句子中各词对应的词向量输入至预设的长短期记忆模型中进行特征提取,得到各句子的特征向量。最后,根据各句子的特征向量对各句子进行情感分类,得到各句子的第二标签。这种实现方式中,步骤203中的预设的情感分析模型为初始情感分析模型。该情况下,无需对初始情感分析模型进行训练得到情感分析模型,即该情况下无需执行上述步骤301-步骤302。
可以理解的是,在第一种实现方式中,需要先利用参考文本对通过对初始情感分析模型进行预训练后得到情感分析模型,然后再利用目标文本对情感分析模型进行训练得到目标情感分析模型。其中,在利用目标文本对情感分析模型进行训练得到目标情感分析模型的过程中,是直接根据情感分析模型得到句子的特征向量。而在第二种实现方式中,不需要利用参考文本对初始情感分析模型进行预训练,直接利用目标文本对模型进行训练得到目标情感分析模型。但这种实现方式中,句子的特征向量的得到还需要将各句子中各词对应的词向量输入至预设的长短期记忆模型中进行特征提取,才能得到各句子的特征向量。
在第二种实现方式中,直接利用没有经过预训练的BERT模型来对句子/文本做分类的效果并不是很理想,通过调研研究发现之所以效果这么差,是因为句子的特征向量(即CLS向量),在预训练任务中,参与的损失是下句预测任务,优化的目标是下一句话。更详细的来讲,在BERT的预训练中,两个连续的句子是正样本,前一句随机找一个句子当作负样本。所以CLS所表示的特征是上下文关联,而不是其它。如果下游的任务是语句是否通顺,那么CLS效果应该也不差,但是换做其他的任务,比如语义相似度或者句子/文本分类,那么效果便会大大折扣。因此我们采取BERT模型的输出作为双向长短期记忆模型(Bi-LSTM)的输入,通过双向的长短期记忆模型进一步的学习包含上下文信息的句子/文本表征,进而利用一个线性分类层对句子/文本做线性分类,这样可以提高文本情感分类的精度。
可选的,上述得到各句子的第二标签的两种方式中的根据各句子的特征向量对各句子进行情感分类,得到各句子的第二标签的过程可以为:将各句子的特征向量输入至预设的全连接神经网络线性分类层中进行分类处理,得到各句子对于不同情感类型的结果值。然后,将各句子对于不同情感类型的结果值进行归一化处理,得到各句子对于不同情感类型的预测分类概率。最后,对于各句子,根据句子对于不同情感类型的预测分类概率确定各句子的第二标签。
如图4所示,本申请实施例还提供了一种文本情感分析模型的训练装置,该装置包括:
获取模块11,用于获取目标文本,并获取目标文本包括的多个句子中各句子的第一标签,第一标签用于指示句子的实际情感类型;
确定模块12,用于确定各句子中各词的字向量和位置向量,字向量用于指示词的内容信息,位置向量用于指示词在句子中的位置信息;
处理模块13,用于根据各句子中各词的字向量和位置向量,以及预设的情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的第二标签,第二标签用于指示句子的预测情感类型;
训练模块14,用于根据各句子的第一标签和第二标签,对情感分析模型进行训练,直至各句子的第一标签与第二标签满足第一预设条件为止,得到目标情感分析模型。
在一个实施例中,处理模块13具体用于:
根据各句子中各词的字向量和位置向量以及情感分析模型,对各句子中的词之间的语义相关性进行分析处理,得到各句子的特征向量;
根据各句子的特征向量对各句子进行情感分类,得到各句子的第二标签。
在一个实施例中,获取模块11还用于:获取参考文本,并确定参考文本中各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量,参考字向量用于指示参考词的内容信息,参考位置向量用于指示参考词在参考句子中的位置信息,参考文本向量用于指示参考词对应的参考句子的内容信息;
训练模块14,还用于根据各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量对预设的初始情感分析模型进行训练,直至初始情感分析模型收敛,得到情感分析模型。
在一个实施例中,训练模块14具体用于:
根据各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量,确定各参考句子中各参考词的参考词向量;
将各参考句子包括的参考词向量输入至初始情感分析模型中,进行语义关联的编码处理,得到各参考句子的句子向量;
将各句子向量输入至初始情感分析模型中进行解码处理,得到各句子向量解码后的各参考词的解码字向量、解码位置向量和解码文本向量;
将各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量作为真实解码标签,将各参考句子中各参考词的解码字向量、解码位置向量和解码文本向量作为预测解码标签;
根据真实解码标签和预测解码标签对初始情感分析模型进行训练,直至初始情感分析模型收敛,得到情感分析模型。
在一个实施例中,处理模块13还用于:
将各句子中各词的字向量和位置向量输入至初始情感分析模型中,对各句子中的词之间的语义相关性进行分析处理,得到各句子中各词对应的词向量;
将各句子中各词对应的词向量输入至预设的长短期记忆模型中进行特征提取,得到各句子的特征向量;
根据各句子的特征向量对各句子进行情感分类,得到各句子的第二标签。
在一个实施例中,处理模块13具体用于:
将各句子的特征向量输入至预设的全连接神经网络线性分类层中进行分类处理,得到各句子对于不同情感类型的结果值;
将各句子对于不同情感类型的结果值进行归一化处理,得到各句子对于不同情感类型的预测分类概率;
对于各句子,根据句子对于不同情感类型的预测分类概率确定各句子的第二标签。
在一个实施例中,第一标签还包括实际情感类型的实际概率,预设条件包括:各句子实际情感类型对应的实际概率与实际情感类型对应的预测分类概率之间的概率差值的绝对值小于预设阈值。
本实施例提供的文本情感分析模型的训练装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再多加赘述。
关于文本情感分析模型的训练装置的具体限定可以参见上文中对于文本情感分析模型的训练方法的限定,在此不再赘述。上述文本情感分析模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于服务器中的处理器中,也可以以软件形式存储于服务器中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本申请的另一实施例中,还提供一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时实现如本申请实施例的文本情感分析模型的训练的步骤。
本申请另一实施例中,还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如本申请实施例的文本情感分析模型的训练方法的步骤。
本申请另一实施例中,还提供一种计算机程序产品,该计算机程序产品包括计算机指令,当计算机指令在文本情感分析模型的训练装置上运行时,使得文本情感分析模型的训练装置执行上述方法实施例所示的方法流程中文本情感分析模型的训练方法执行的各个步骤。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件程序实现时,可以全部或部分地以计算机程序产品的形式来实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机执行指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(digitalsubscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可以用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质(例如,软盘、硬盘、磁带),光介质(例如,DVD)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种文本情感分析模型的训练方法,其特征在于,所述方法包括:
获取目标文本,并获取所述目标文本包括的多个句子中各所述句子的第一标签,所述第一标签用于指示所述句子的实际情感类型;
确定各所述句子中各词的字向量和位置向量,所述字向量用于指示所述词的内容信息,所述位置向量用于指示所述词在所述句子中的位置信息;
根据各所述句子中各词的字向量和位置向量,以及预设的情感分析模型,对各所述句子中的词之间的语义相关性进行分析处理,得到各所述句子的第二标签,所述第二标签用于指示所述句子的预测情感类型;
根据各所述句子的第一标签和第二标签,对所述情感分析模型进行训练,直至各所述句子的第一标签与第二标签满足第一预设条件为止,得到目标情感分析模型。
2.根据权利要求1所述的方法,其特征在于,所述根据各所述句子中各词的字向量和位置向量,以及预设的情感分析模型,对各所述句子中的词之间的语义相关性进行分析处理,得到各所述句子的第二标签,包括:
根据各所述句子中各词的字向量和位置向量以及所述情感分析模型,对各所述句子中的词之间的语义相关性进行分析处理,得到各所述句子的特征向量;
根据各所述句子的特征向量对各所述句子进行情感分类,得到各所述句子的第二标签。
3.根据权利要求2所述的方法,其特征在于,所述获取目标文本之前,所述方法还包括:
获取参考文本,并确定所述参考文本中各参考句子中各参考词的参考字向量、参考位置向量和参考文本向量,所述参考字向量用于指示所述参考词的内容信息,所述参考位置向量用于指示所述参考词在所述参考句子中的位置信息,所述参考文本向量用于指示所述参考词对应的参考句子的内容信息;
根据各所述参考句子中各参考词的参考字向量、参考位置向量和所述参考文本向量对预设的初始情感分析模型进行训练,直至所述初始情感分析模型收敛,得到所述情感分析模型。
4.根据权利要求3所述的方法,其特征在于,所述根据各所述参考句子中各参考词的参考字向量、参考位置向量和所述参考文本向量对预设的初始情感分析模型进行训练,直至所述初始情感分析模型收敛,得到所述情感分析模型,包括:
根据各所述参考句子中各参考词的参考字向量、参考位置向量和参考文本向量,确定各所述参考句子中各参考词的参考词向量;
将各所述参考句子包括的参考词向量输入至所述初始情感分析模型中,进行语义关联的编码处理,得到各所述参考句子的句子向量;
将各所述句子向量输入至所述初始情感分析模型中进行解码处理,得到各所述句子向量解码后的各参考词的解码字向量、解码位置向量和解码文本向量;
将各所述参考句子中各参考词的参考字向量、参考位置向量和参考文本向量作为真实解码标签,将各所述参考句子中各参考词的解码字向量、解码位置向量和解码文本向量作为预测解码标签;
根据所述真实解码标签和所述预测解码标签对所述初始情感分析模型进行训练,直至所述初始情感分析模型收敛,得到所述情感分析模型。
5.根据权利要求1所述的方法,其特征在于,所述根据各所述句子中各词的字向量和位置向量,以及预设的情感分析模型,对各所述句子中的词之间的语义相关性进行分析处理,得到各所述句子的第二标签,包括:
将各所述句子中各词的字向量和位置向量输入至初始情感分析模型中,对各所述句子中的词之间的语义相关性进行分析处理,得到各所述句子中各词对应的词向量;
将各所述句子中各词对应的词向量输入至预设的长短期记忆模型中进行特征提取,得到各所述句子的特征向量;
根据各所述句子的特征向量对各所述句子进行情感分类,得到各所述句子的第二标签。
6.根据权利要求2或5所述的方法,其特征在于,所述根据各所述句子的特征向量对各所述句子进行情感分类,得到各所述句子的第二标签,包括:
将各所述句子的特征向量输入至预设的全连接神经网络线性分类层中进行分类处理,得到各所述句子对于不同情感类型的结果值;
将各所述句子对于不同情感类型的结果值进行归一化处理,得到各所述句子对于不同情感类型的预测分类概率;
对于各所述句子,根据所述句子对于不同情感类型的预测分类概率确定各所述句子的第二标签。
7.根据权利要求6所述的方法,其特征在于,所述第一标签还包括实际情感类型的实际概率,所述预设条件包括:
各所述句子实际情感类型对应的实际概率与所述实际情感类型对应的预测分类概率之间的概率差值的绝对值小于预设阈值。
8.一种文本情感分析模型的训练装置,其特征在于,所述装置包括:
获取模块,用于获取目标文本,并获取所述目标文本包括的多个句子中各所述句子的第一标签,所述第一标签用于指示所述句子的实际情感类型;
确定模块,用于确定各所述句子中各词的字向量和位置向量,所述字向量用于指示所述词的内容信息,所述位置向量用于指示所述词在所述句子中的位置信息;
处理模块,用于根据各所述句子中各词的字向量和位置向量,以及预设的情感分析模型,对各所述句子中的词之间的语义相关性进行分析处理,得到各所述句子的第二标签,所述第二标签用于指示所述句子的预测情感类型;
训练模块,用于根据各所述句子的第一标签和第二标签,对所述情感分析模型进行训练,直至各所述句子的第一标签与第二标签满足第一预设条件为止,得到目标情感分析模型。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现权利要求1-7任一项所述的文本情感分析模型的训练方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的文本情感分析模型的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210882802.4A CN115169345A (zh) | 2022-07-22 | 2022-07-22 | 文本情感分析模型的训练方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210882802.4A CN115169345A (zh) | 2022-07-22 | 2022-07-22 | 文本情感分析模型的训练方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115169345A true CN115169345A (zh) | 2022-10-11 |
Family
ID=83498017
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210882802.4A Pending CN115169345A (zh) | 2022-07-22 | 2022-07-22 | 文本情感分析模型的训练方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115169345A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117540725A (zh) * | 2024-01-05 | 2024-02-09 | 摩尔线程智能科技(北京)有限责任公司 | 方面级情感分析方法、装置、电子设备和存储介质 |
-
2022
- 2022-07-22 CN CN202210882802.4A patent/CN115169345A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117540725A (zh) * | 2024-01-05 | 2024-02-09 | 摩尔线程智能科技(北京)有限责任公司 | 方面级情感分析方法、装置、电子设备和存储介质 |
CN117540725B (zh) * | 2024-01-05 | 2024-03-22 | 摩尔线程智能科技(北京)有限责任公司 | 方面级情感分析方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108121700B (zh) | 一种关键词提取方法、装置及电子设备 | |
CN107679039B (zh) | 用于确定语句意图的方法和装置 | |
CN109493977B (zh) | 文本数据处理方法、装置、电子设备及计算机可读介质 | |
CN112101041B (zh) | 基于语义相似度的实体关系抽取方法、装置、设备及介质 | |
US10915756B2 (en) | Method and apparatus for determining (raw) video materials for news | |
CN111046656A (zh) | 文本处理方法、装置、电子设备及可读存储介质 | |
CN112231569A (zh) | 新闻推荐方法、装置、计算机设备及存储介质 | |
US11036996B2 (en) | Method and apparatus for determining (raw) video materials for news | |
CN109190123B (zh) | 用于输出信息的方法和装置 | |
CN110633475A (zh) | 基于计算机场景的自然语言理解方法、装置、系统和存储介质 | |
CN113434636A (zh) | 基于语义的近似文本搜索方法、装置、计算机设备及介质 | |
CN111291551B (zh) | 文本处理方法、装置、电子设备及计算机可读存储介质 | |
CN113947086A (zh) | 样本数据生成方法、训练方法、语料生成方法和装置 | |
CN114817478A (zh) | 基于文本的问答方法、装置、计算机设备及存储介质 | |
CN115438149A (zh) | 一种端到端模型训练方法、装置、计算机设备及存储介质 | |
CN115146068A (zh) | 关系三元组的抽取方法、装置、设备及存储介质 | |
CN115169345A (zh) | 文本情感分析模型的训练方法、装置、设备及存储介质 | |
CN115730237B (zh) | 垃圾邮件检测方法、装置、计算机设备及存储介质 | |
CN115858776B (zh) | 一种变体文本分类识别方法、系统、存储介质和电子设备 | |
CN110888983A (zh) | 一种正负面情感分析方法、终端设备及存储介质 | |
CN108021609B (zh) | 文本情感分类方法、装置、计算机设备和存储介质 | |
CN114548109B (zh) | 命名实体识别模型训练方法及命名实体识别方法 | |
Natarajan et al. | Spam detection over call transcript using deep learning | |
CN112364649B (zh) | 命名实体的识别方法、装置、计算机设备及存储介质 | |
CN114676699A (zh) | 实体情感分析方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |