CN115878808A - 一种层级标签分类模型的训练方法及装置 - Google Patents

一种层级标签分类模型的训练方法及装置 Download PDF

Info

Publication number
CN115878808A
CN115878808A CN202310193427.7A CN202310193427A CN115878808A CN 115878808 A CN115878808 A CN 115878808A CN 202310193427 A CN202310193427 A CN 202310193427A CN 115878808 A CN115878808 A CN 115878808A
Authority
CN
China
Prior art keywords
result
training
loss
classification model
label classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310193427.7A
Other languages
English (en)
Inventor
陈莹莹
陈第
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Youmi Technology Co ltd
Original Assignee
Youmi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Youmi Technology Co ltd filed Critical Youmi Technology Co ltd
Priority to CN202310193427.7A priority Critical patent/CN115878808A/zh
Publication of CN115878808A publication Critical patent/CN115878808A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种层级标签分类模型的训练方法及装置,该方法包括:基于训练数据对基础层级标签分类模型进行训练输出局部文本特征训练结果及全局文本特征训练结果;根据局部文本特征训练结果及全局文本特征训练结果确定文本特征损失情况;根据文本特征损失情况,判断基础层级标签分类模型是否收敛;若是,确定训练后的基础层级标签分类模型收敛,收敛后的基础层级标签分类模型用于确定待标签分类文本的层级标签。可见,本发明提供一种层级标签分类模型训练方式,提高文本特征损失情况的准确性和可靠性,进而提高层级标签分类模型的训练精准性,从而提高层级标签分类模型的收敛及时性、可靠性和效率,以及提高层级标签的分类准确性和可靠性。

Description

一种层级标签分类模型的训练方法及装置
技术领域
本发明涉及标签分类技术领域,尤其涉及一种层级标签分类模型的训练方法及装置。
背景技术
随着大数据时代的飞速发展,对文本数据进行标签分类的需求也愈发增多。日常业务中,时常会涉及到一些带有层级的标签的分类任务,例如,针对某一文本数据:男鞋秋季新款休闲运动鞋韩版潮流跑步鞋轻便透气青年旅游鞋子,其对应标签为:服饰鞋包|鞋靴|男鞋|男帆布鞋,该标签为有层级关系的标签。然而,实践表明,现有的标签分类方式大多对带有层级关系的标签间的联系考量较少,导致层级标签的分类准确性较低。可见,提供一种能够提高分类准确性的方式显得尤为重要。
发明内容
本发明内容所要解决的技术问题在于,提供一种层级标签分类模型的训练方法及装置,能够提高文本标签分类准确性。
为了解决上述技术问题,本发明第一方面公开了一种层级标签分类模型的训练方法,所述方法包括:
基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果;
根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的文本特征损失确定条件,确定所述基础层级标签分类模型的文本特征损失情况;
根据所述文本特征损失情况,判断所述基础层级标签分类模型是否满足预设的模型训练收敛条件;
当判断结果为是时,确定训练后的所述基础层级标签分类模型收敛,收敛后的所述基础层级标签分类模型用于确定待标签分类文本的层级标签。
作为一种可选的实施方式,在本发明第一方面中,所述基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果,包括:
将预先确定出的训练数据输入至基础层级标签分类模型所包括的第一变量提取层集合中进行分析,得到中间变量结果集合,并根据所述中间变量结果集合及预设的第一拼接处理条件,确定所述训练数据对应的全局文本特征训练结果;
基于所述中间变量结果集合对所述基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果;
其中,所述中间变量结果集合所对应的中间变量数量与所述第一变量提取层集合所对应的第一变量提取层数量相匹配。
作为一种可选的实施方式,在本发明第一方面中,所述基于所述中间变量结果集合对所述基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果,包括:
将所述中间变量结果输入至所述基础层级标签分类模型所包括的第二变量提取层集合中进行分析,得到层级变量结果集合;
根据所述层级变量结果集合及预设的第二拼接处理条件,确定所述训练数据对应的局部文本特征训练结果;
其中,所述层级变量结果集合所对应的层级变量结果数量与所述第二变量提取层集合所对应的第二变量提取层数量相匹配。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的文本特征损失确定条件,确定所述基础层级标签分类模型的文本特征损失情况,包括:
根据所述全局文本特征训练结果及预设的所述训练数据对应的真实文本特征,确定第一训练特征损失结果,并根据所述局部文本特征训练结果及所述真实文本特征,确定第二训练特征损失结果;
根据所述第一训练特征损失结果及所述第二训练特征损失结果,确定第一损失结果;
根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的欧式距离分析条件,确定第二损失结果;
根据所述第一损失结果及所述第二损失结果,确定文本特征损失情况。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的欧式距离分析条件,确定第二损失结果,包括:
根据所述局部文本特征训练结果,从预构建的第一标签数据集中筛选出满足预设的第一层级匹配度筛选条件的第一父类标签及第一子类标签,并根据所述第一父类标签、所述第一子类标签及预设的标签映射处理条件,确定第一父类特征及第一子类特征;
根据所述全局文本特征训练结果,从预构建的第二标签数据集中筛选出满足预设的第二层级匹配度筛选条件的第二父类标签及第二子类标签,并根据所述第二父类标签、所述第二子类标签及所述标签映射处理条件,确定第二父类特征及第二子类特征;
根据所述第一父类特征、所述第一子类特征及预设的欧式距离计算条件,确定第一欧式距离结果,并根据所述第二父类特征、所述第二子类特征及所述欧式距离计算条件,确定第二欧式距离结果;
根据所述第一欧式距离结果及所述第二欧式距离结果,确定第二损失结果。
作为一种可选的实施方式,在本发明第一方面中,所述根据所述第一损失结果及所述第二损失结果,确定文本特征损失情况,包括:
根据预先确定出的标签特征差异需求,确定所述第一损失结果对应的第一损失权重计算信息及所述第二损失结果对应的第二损失权重计算信息;
根据所述第一损失结果、所述第二损失结果、所述第一损失权重计算信息及所述第二损失权重计算信息,确定文本特征损失情况;
以及,所述文本特征损失情况通过以下公式得到:
Figure SMS_1
其中,loss为所述文本特征损失情况,losscls为所述第一损失结果,losshierar为所述第二损失结果,
Figure SMS_2
为所述第一损失权重计算信息对应的第一权重值,
Figure SMS_3
为所述第二损失权重计算信息对应的第二权重值。
作为一种可选的实施方式,在本发明第一方面中,所述方法还包括:
将待标签分类数据输入至训练收敛的所述基础层级标签分类模型中进行分析,得到所述待标签分类数据的全局特征预测结果及局部特征预测结果,并根据预先确定出的标签特征差异需求所确定出的损失权重计算信息,确定所述全局特征预测结果对应的第一预测权重计算信息及所述局部特征预测结果对应的第二预测权重计算信息;
根据所述全局特征预测结果、所述局部特征预测结果、所述第一预测权重计算信息及所述第二预测权重计算信息,确定所述待标签分类数据对应的标签分类结果;
以及,所述待标签分类数据对应的标签分类结果通过以下公式得到:
Figure SMS_4
其中,
Figure SMS_5
为所述标签分类结果,
Figure SMS_6
为全局特征预测结果,
Figure SMS_7
为所述局部特征预测结果,
Figure SMS_8
为所述第一预测权重计算信息对应的第三权重值,
Figure SMS_9
为所述第二预测权重计算信息对应的第四权重值,所述第一预测权重计算信息对应的第三权重值与预先确定出的标签特征差异需求所确定出的损失权重计算信息对应的权重值相匹配。
本发明第二方面公开了一种层级标签分类模型的训练装置,所述装置包括:
特征获取模块,用于基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果;
损失确定模块,用于根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的文本特征损失确定条件,确定所述基础层级标签分类模型的文本特征损失情况;
判断模块,用于根据所述文本特征损失情况,判断所述基础层级标签分类模型是否满足预设的模型训练收敛条件;
确定模块,用于当所述判断模块判断出所述基础层级标签分类模型满足所述模型训练收敛条件时,确定训练后的所述基础层级标签分类模型收敛,收敛后的所述基础层级标签分类模型用于确定待标签分类文本的层级标签。
作为一种可选的实施方式,在本发明第二方面中,所述特征获取模块基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果的方式具体包括:
将预先确定出的训练数据输入至基础层级标签分类模型所包括的第一变量提取层集合中进行分析,得到中间变量结果集合,并根据所述中间变量结果集合及预设的第一拼接处理条件,确定所述训练数据对应的全局文本特征训练结果;
基于所述中间变量结果集合对所述基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果;
其中,所述中间变量结果集合所对应的中间变量数量与所述第一变量提取层集合所对应的第一变量提取层数量相匹配。
作为一种可选的实施方式,在本发明第二方面中,所述特征获取模块基于所述中间变量结果集合对所述基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果的方式具体包括:
将所述中间变量结果输入至所述基础层级标签分类模型所包括的第二变量提取层集合中进行分析,得到层级变量结果集合;
根据所述层级变量结果集合及预设的第二拼接处理条件,确定所述训练数据对应的局部文本特征训练结果;
其中,所述层级变量结果集合所对应的层级变量结果数量与所述第二变量提取层集合所对应的第二变量提取层数量相匹配。
作为一种可选的实施方式,在本发明第二方面中,所述损失确定模块根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的文本特征损失确定条件,确定所述基础层级标签分类模型的文本特征损失情况的方式具体包括:
根据所述全局文本特征训练结果及预设的所述训练数据对应的真实文本特征,确定第一训练特征损失结果,并根据所述局部文本特征训练结果及所述真实文本特征,确定第二训练特征损失结果;
根据所述第一训练特征损失结果及所述第二训练特征损失结果,确定第一损失结果;
根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的欧式距离分析条件,确定第二损失结果;
根据所述第一损失结果及所述第二损失结果,确定文本特征损失情况。
作为一种可选的实施方式,在本发明第二方面中,所述损失确定模块根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的欧式距离分析条件,确定第二损失结果的方式具体包括:
根据所述局部文本特征训练结果,从预构建的第一标签数据集中筛选出满足预设的第一层级匹配度筛选条件的第一父类标签及第一子类标签,并根据所述第一父类标签、所述第一子类标签及预设的标签映射处理条件,确定第一父类特征及第一子类特征;
根据所述全局文本特征训练结果,从预构建的第二标签数据集中筛选出满足预设的第二层级匹配度筛选条件的第二父类标签及第二子类标签,并根据所述第二父类标签、所述第二子类标签及所述标签映射处理条件,确定第二父类特征及第二子类特征;
根据所述第一父类特征、所述第一子类特征及预设的欧式距离计算条件,确定第一欧式距离结果,并根据所述第二父类特征、所述第二子类特征及所述欧式距离计算条件,确定第二欧式距离结果;
根据所述第一欧式距离结果及所述第二欧式距离结果,确定第二损失结果。
作为一种可选的实施方式,在本发明第二方面中,所述损失确定模块根据所述第一损失结果及所述第二损失结果,确定文本特征损失情况的方式具体包括:
根据预先确定出的标签特征差异需求,确定所述第一损失结果对应的第一损失权重计算信息及所述第二损失结果对应的第二损失权重计算信息;
根据所述第一损失结果、所述第二损失结果、所述第一损失权重计算信息及所述第二损失权重计算信息,确定文本特征损失情况;
以及,所述文本特征损失情况通过以下公式得到:
Figure SMS_10
其中,loss为所述文本特征损失情况,losscls为所述第一损失结果,losshierar为所述第二损失结果,
Figure SMS_11
为所述第一损失权重计算信息对应的第一权重值,
Figure SMS_12
为所述第二损失权重计算信息对应的第二权重值。
作为一种可选的实施方式,在本发明第二方面中,所述特征获取模块,还用于将待标签分类数据输入至训练收敛的所述基础层级标签分类模型中进行分析,得到所述待标签分类数据的全局特征预测结果及局部特征预测结果;
所述确定模块,还用于根据预先确定出的标签特征差异需求所确定出的损失权重计算信息,确定所述全局特征预测结果对应的第一预测权重计算信息及所述局部特征预测结果对应的第二预测权重计算信息;
所述装置还包括:
层级标签确定模块,用于根据所述全局特征预测结果、所述局部特征预测结果、所述第一预测权重计算信息及所述第二预测权重计算信息,确定所述待标签分类数据对应的标签分类结果;
以及,所述待标签分类数据对应的标签分类结果通过以下公式得到:
Figure SMS_13
其中,
Figure SMS_14
为所述标签分类结果,
Figure SMS_15
为全局特征预测结果,
Figure SMS_16
为所述局部特征预测结果,
Figure SMS_17
为所述第一预测权重计算信息对应的第三权重值,
Figure SMS_18
为所述第二预测权重计算信息对应的第四权重值,所述第一预测权重计算信息对应的第三权重值与预先确定出的标签特征差异需求所确定出的损失权重计算信息对应的权重值相匹配。
本发明第三方面公开了另一种层级标签分类模型的训练装置,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明第一方面公开的一种层级标签分类模型的训练方法。
本发明第四方面公开了一种计算机存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行本发明第一方面公开的一种层级标签分类模型的训练方法。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例中,基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到该基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果;根据该局部文本特征训练结果、该全局文本特征训练结果及预设的文本特征损失确定条件,确定该基础层级标签分类模型的文本特征损失情况;根据该文本特征损失情况,判断该基础层级标签分类模型是否满足预设的模型训练收敛条件;当判断结果为是时,确定训练后的该基础层级标签分类模型收敛,收敛后的该基础层级标签分类模型用于确定待标签分类文本的层级标签。可见,本发明能够提供一种层级标签分类模型训练方式,根据确定出的局部文本特征训练结果及全局文本特征训练结果确定文本特征损失情况,并根据文本特征损失情况确定层级标签分类模型的训练收敛情况,有利于提高确定出的文本特征损失情况的准确性和可靠性,进而有利于提高层级标签分类模型的训练精准性,从而有利于提高层级标签分类模型的收敛及时性、可靠性和效率,以及还有利于提高层级标签的分类准确性和可靠性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例公开的一种层级标签分类模型的训练方法的流程示意图;
图2是本发明实施例公开的另一种层级标签分类模型的训练方法的流程示意图;
图3是本发明实施例公开的一种层级标签分类模型的训练装置的结构示意图;
图4是本发明实施例公开的另一种层级标签分类模型的训练装置的结构示意图;
图5是本发明实施例公开的又一种层级标签分类模型的训练装置的结构示意图;
图6是本发明实施例公开的一种层级标签分类模型的训练方法的模型应用框架图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或端没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或端固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本发明公开了一种层级标签分类模型的训练方法及装置,能够提供一种层级标签分类模型训练方式,根据确定出的局部文本特征训练结果及全局文本特征训练结果确定文本特征损失情况,并根据文本特征损失情况确定层级标签分类模型的训练收敛情况,有利于提高确定出的文本特征损失情况的准确性和可靠性,进而有利于提高层级标签分类模型的训练精准性,从而有利于提高层级标签分类模型的收敛及时性、可靠性和效率,以及还有利于提高层级标签的分类准确性和可靠性。以下分别进行详细说明。
实施例一
请参阅图1,图1是本发明实施例公开的一种层级标签分类模型的训练方法的流程示意图。其中,图1所描述的方法可以应用于一种层级标签分类模型的训练装置,其中,该装置可以包括服务器,其中,服务器包括本地服务器或者云服务器,本发明实施例不做限定。如图1所示,该一种层级标签分类模型的训练方法包括以下操作:
101、基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果。
可选的,基础层级标签分类模型所对应的标签分类应用流程可参照说明书附图图6所示,其中,x为输入文本数据(即训练数据或待标签分类数据),PG为全局文本特征(即全局文本特征训练结果或全局特征预测结果),PL为局部文本特征(即局部文本特征训练结果或局部特征预测结果),PF为基础层级标签分类模型输出的输入文本数据所对应的文本标签分类结果,本发明实施例不做限定。
可选的,预先确定出的训练数据可以是文本数据,即采用bert预训练模型的编码方式将文本数据为文本编码表示、掩码编码表示,本发明实施例不做限定。
102、根据局部文本特征训练结果、全局文本特征训练结果及预设的文本特征损失确定条件,确定基础层级标签分类模型的文本特征损失情况。
可选的,文本特征损失确定条件包括欧式距离损失确定条件、交叉熵损失函数损失确定条件等,本发明实施例不做限定。
103、根据文本特征损失情况,判断基础层级标签分类模型是否满足预设的模型训练收敛条件。
进一步可选的,当判断出基础层级标签分类模型不满足模型训练收敛条件时,根据文本特征损失情况确定基础层级标签分类模型对应的层级参数调整信息,并根据层级参数调整信息更新基础层级标签分类模型;对更新后的基础层级标签分类模型进行模型训练操作,直至基础层级标签分类模型训练至收敛,本发明实施例不做限定。
104、当判断结果为是时,确定训练后的基础层级标签分类模型收敛,收敛后的基础层级标签分类模型用于确定待标签分类文本的层级标签。
可见,实施本发明实施例所描述的一种层级标签分类模型的训练方法能够提供一种层级标签分类模型训练方式,根据确定出的局部文本特征训练结果及全局文本特征训练结果确定文本特征损失情况,并根据文本特征损失情况确定层级标签分类模型的训练收敛情况,有利于提高确定出的文本特征损失情况的准确性和可靠性,进而有利于提高层级标签分类模型的训练精准性,从而有利于提高层级标签分类模型的收敛及时性、可靠性和效率,以及还有利于提高层级标签的分类准确性和可靠性。
在一个可选的实施例中,上述基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果,可以包括:
将预先确定出的训练数据输入至基础层级标签分类模型所包括的第一变量提取层集合中进行分析,得到中间变量结果集合,并根据中间变量结果集合及预设的第一拼接处理条件,确定训练数据对应的全局文本特征训练结果;
基于中间变量结果集合对基础层级标签分类模型进行训练,得到基础层级标签分类模型输出的局部文本特征训练结果;
其中,中间变量结果集合所对应的中间变量数量与第一变量提取层集合所对应的第一变量提取层数量相匹配。
可选的,中间变量结果集合包括至少一个中间变量结果,所有中间变量结果的维度相一致,本发明实施例不做限定。
可选的,第一变量提取层集合所包括的第一变量提取层可对应说明书附图图6中的BERTG层,本发明实施例不做限定。
可选的,中间变量结果集合所对应的中间变量数量与第一变量提取层集合所对应的第一变量提取层数量相匹配,可以是中间变量数量与第一变量层数量相一致,本发明实施例不做限定。
可选的,第一拼接处理条件可以是权重拼接处理条件,也可以是其它拼接融合处理条件,本发明实施例不做限定。
可见,该可选的实施例能够根据训练数据及第一变量提取层集合确定出中间变量结果集合,并根据中间变量结果集合确定出全局文本特征训练结果及局部文本特征训练结果,有利于提高文本特征训练结果确定方式的合理性,进而有利于提高确定出的文本特征训练结果的准确性和可靠性,以及还提供一种中间变量结果集合拼接处理方式得到全局文本特征训练结果,有利于提高全局文本特征训练结果确定方式的全面性和合理性,进而有利于提高全局文本特征训练结果的确定准确性和确定效率。
在另一个可选的实施例中,上述基于中间变量结果集合对基础层级标签分类模型进行训练,得到基础层级标签分类模型输出的局部文本特征训练结果,可以包括:
将中间变量结果输入至基础层级标签分类模型所包括的第二变量提取层集合中进行分析,得到层级变量结果集合;
根据层级变量结果集合及预设的第二拼接处理条件,确定训练数据对应的局部文本特征训练结果;
其中,层级变量结果集合所对应的层级变量结果数量与第二变量提取层集合所对应的第二变量提取层数量相匹配。
可选的,第二变量提取层集合所包括的第二变量提取层的层级参数与上述第一变量提取层集合所包括的第一变量提取层的层级参数相匹配,本发明实施例不做限定。
可选的,第二变量提取层集合所包括的第二变量提取层可对应说明书附图图6中的BERTL层,层级变量结果集合所包括的层级变量结果可对应说明书附图图6中的PL X,本发明实施例不做限定。
可选的,层级变量结果集合所对应的层级变量结果数量与第二变量提取层集合所对应的第二变量提取层数量相匹配,可以是层级变量结果数量与第二变量提取层数量相一致,本发明实施例不做限定。
可选的,第二拼接处理条件可以是权重拼接处理条件,也可以是其它拼接融合处理条件,以及第二拼接处理条件与第一拼接处理条件可以相匹配或不匹配,本发明实施例不做限定。
可见,该可选的实施例能够根据中间变量结果及第二变量提取层集合确定出层级变量结果集合,并根据层级变量结果集合及第二拼接处理条件确定局部文本特征训练结果,有利于提高局部文本特征训练结果确定方式的全面性和合理性,进而有利于提高确定出的局部文本特征训练结果的准确性和可靠性。
在又一个可选的实施例中,上述根据局部文本特征训练结果、全局文本特征训练结果及预设的文本特征损失确定条件,确定基础层级标签分类模型的文本特征损失情况,可以包括:
根据全局文本特征训练结果及预设的训练数据对应的真实文本特征,确定第一训练特征损失结果,并根据局部文本特征训练结果及真实文本特征,确定第二训练特征损失结果;
根据第一训练特征损失结果及第二训练特征损失结果,确定第一损失结果;
根据局部文本特征训练结果、全局文本特征训练结果及预设的欧式距离分析条件,确定第二损失结果;
根据第一损失结果及第二损失结果,确定文本特征损失情况。
可选的,根据第一训练特征损失结果及第二训练特征损失结果,确定第一损失结果,可以是将第一训练特征损失结果及第二训练特征损失结果加权求和得到第一损失结果,也可以是其它训练特征损失结果融合处理方式得到第一损失结果,本发明实施例不做限定。
可选的,第一训练特征损失结果、第二训练特征损失结果可采用交叉熵损失函数确定得到,本发明实施例不做限定。
可选的,损失结果、文本特征损失情况可以是以损失函数的形式表示,也可以是以具体损失值的形式表示,本发明实施例不做限定。
可见,该可选的实施例能够根据真实文本特征比对条件确定出第一损失结果并根据欧式距离分析条件确定出第二损失结果,进而根据第一损失结果及第二损失结果确定出文本特征损失情况,有利于提高损失结果确定方式的灵活性和全面性,进而有利于提高确定出的损失结果的准确性和可靠性,以及还有利于提高文本特征损失情况确定方式的全面性,从而有利于提高确定出的文本特征损失情况的准确性和可靠性。
在又一个可选的实施例中,上述根据局部文本特征训练结果、全局文本特征训练结果及预设的欧式距离分析条件,确定第二损失结果,可以包括:
根据局部文本特征训练结果,从预构建的第一标签数据集中筛选出满足预设的第一层级匹配度筛选条件的第一父类标签及第一子类标签,并根据第一父类标签、第一子类标签及预设的标签映射处理条件,确定第一父类特征及第一子类特征;
根据全局文本特征训练结果,从预构建的第二标签数据集中筛选出满足预设的第二层级匹配度筛选条件的第二父类标签及第二子类标签,并根据第二父类标签、第二子类标签及标签映射处理条件,确定第二父类特征及第二子类特征;
根据第一父类特征、第一子类特征及预设的欧式距离计算条件,确定第一欧式距离结果,并根据第二父类特征、第二子类特征及欧式距离计算条件,确定第二欧式距离结果;
根据第一欧式距离结果及第二欧式距离结果,确定第二损失结果。
可选的,第一标签数据集与第二标签数据集可以是同一内容的数据集,也可以是不同内容的数据集,本发明实施例不做限定。
可选的,第一层级匹配度筛选条件、第二层级匹配度筛选条件,可以是特征训练结果与标签数据集中父类标签匹配概率最高且满足高层筛选条件、子类标签匹配概率最高且满足高层筛选条件的标签数据,本发明实施例不做限定。进一步的,对于父类标签、子类标签、分类特征、子类特征的确定方式,举例说明:如果标签是“服饰鞋包|鞋靴|男鞋|男帆布鞋”,而且其父类标签“服饰鞋包|鞋靴|男鞋”、“服饰鞋包|鞋靴”、“服饰鞋包”也存在在标签数据集中,提取的父类特征即为父类标签映射为id后对应的全连接层的特征,子类特征即为“服饰鞋包|鞋靴|男鞋|男帆布鞋”映射为id后对应全连接层的特征,本发明实施例不做限定。
可选的,将第一欧式距离结果及第二欧式距离结果进行加权求和处理得到第二损失结果,本发明实施例不做限定。
可见,该可选的实施例能够根据层级匹配度筛选条件及标签映射处理条件确定父类特征及子类特征,并根据父类特征、子类特征及欧式距离计算条件确定欧式距离结果进而确定出第二损失结果,有利于提高第二损失结果确定方式的全面性和合理性,进而有利于提高确定出的第二损失结果的准确性和可靠性。
在又一个可选的实施例中,上述根据第一损失结果及第二损失结果,确定文本特征损失情况,可以包括:
根据预先确定出的标签特征差异需求,确定第一损失结果对应的第一损失权重计算信息及第二损失结果对应的第二损失权重计算信息;
根据第一损失结果、第二损失结果、第一损失权重计算信息及第二损失权重计算信息,确定文本特征损失情况;
以及,文本特征损失情况通过以下公式得到:
Figure SMS_19
其中,loss为文本特征损失情况,losscls为第一损失结果,losshierar为第二损失结果,
Figure SMS_20
为第一损失权重计算信息对应的第一权重值,
Figure SMS_21
为第二损失权重计算信息对应的第二权重值。
可选的,标签特征差异需求可以是真实文本标签与其父类标签之间的特征差异需求,本发明实施例不做限定。
可见,该可选的实施例能够确定出不同损失结果所对应的损失权重计算信息并根据损失结果及相应的损失权重计算信息确定出文本特征损失情况,有利于提高文本特征损失情况确定方式的全面性和合理性,进而有利于提高确定出的文本特征损失情况的准确性和可靠性;以及,还能够提供文本特征损失情况计算公式,提高了文本特征损失情况确定方式的科学性和合理性,进而有利于提高确定出的文本特征损失情况的准确性和可靠性。
在又一个可选的实施例中,上述根据文本特征损失情况,判断基础层级标签分类模型是否满足预设的模型训练收敛条件,可以包括:
根据文本特征损失情况及预设的模型收敛分析条件,确定训练收敛度;
判断训练收敛度是否大于等于预设的训练收敛度阈值;
当判断出训练收敛度大于等于训练收敛度阈值时,确定基础层级标签分类模型满足预设的模型训练收敛条件;
当判断出训练收敛度小于训练收敛度阈值时,确定基础层级标签分类模型不满足预设的模型训练收敛条件;
其中,模型收敛分析条件包括特征损失程度分析条件、特征损失优化变化趋势分析条件及特征损失优化程度分析条件中的一种或多种。
可选的,特征损失程度分析条件可以是通过特征损失值、特征损失差异值、特征损失变化值及其它能反映特征损失程度的参数中的一种或多种进行分析得到训练收敛度,本发明实施例不做限定。
可选的,特征损失优化变化趋势分析条件可以是通过特征损失值变化趋势、特征损失差异值变化趋势、特征损失优化值变化趋势及其它能够反映特征损失优化变化情况的参数中的一种或多种进行分析得到训练收敛度,本发明实施例不做限定。
可选的,特征损失优化程度分析条件可以是通过能够反映特征损失优化情况的参数进行分析得到训练收敛度,本发明实施例不做限定。
可见,该可选的实施例能够提供模型训练收敛判断方式,根据文本特征损失情况确定训练收敛度并根据训练收敛度与训练收敛度阈值大小比较关系确定模型训练收敛情况,有利于提高模型训练收敛情况确定方式的全面性和合理性,进而有利于提高确定出的模型训练收敛情况的准确性和可靠性,从而有利于提高基础层级标签分类模型的收敛及时性和收敛可靠性。
实施例二
请参阅图2,图2是本发明实施例公开的另一种层级标签分类模型的训练方法的流程示意图。其中,图2所描述的方法可以应用于一种层级标签分类模型的训练装置,其中,该装置可以包括服务器,其中,服务器包括本地服务器或者云服务器,本发明实施例不做限定。如图2所示,该一种层级标签分类模型的训练方法包括以下操作:
201、基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果。
202、根据局部文本特征训练结果、全局文本特征训练结果及预设的文本特征损失确定条件,确定基础层级标签分类模型的文本特征损失情况。
203、根据文本特征损失情况,判断基础层级标签分类模型是否满足预设的模型训练收敛条件。
204、当判断结果为是时,确定训练后的基础层级标签分类模型收敛,收敛后的基础层级标签分类模型用于确定待标签分类文本的层级标签。
205、将待标签分类数据输入至训练收敛的基础层级标签分类模型中进行分析,得到待标签分类数据的全局特征预测结果及局部特征预测结果。
可选的,全局特征预测结果可以是通过训练收敛的基础层级标签分类模型所包括的第一变量提取层集合及预设的第三拼接处理条件得到的,局部特征预测结果可以是通过训练收敛的基础层级标签分类模型所包括的第一变量提取层集合、训练收敛的基础层级标签分类模型所包括的第二变量提取层集合、预设的第三拼接处理条件得到的,本发明实施例不做限定。进一步的,根据待标签分类数据的标签层级数量要求确定所采用的训练收敛的基础层级标签分类模型所包括的第一变量提取层集合、训练收敛的基础层级标签分类模型所包括的第二变量提取层集合的提取层数量,本发明实施例不做限定。
需要说明的是,全局特征预测结果、局部特征预测结果的其它确定步骤可以参照但不限于上述提及的全局文本特征训练结果、局部文本特征训练结果的确定步骤,本发明实施例不做限定。
206、根据预先确定出的标签特征差异需求所确定出的损失权重计算信息,确定全局特征预测结果对应的第一预测权重计算信息及局部特征预测结果对应的第二预测权重计算信息。
可选的,上述根据预先确定出的标签特征差异需求所确定出的损失权重计算信息可以是:根据预先确定出的标签特征差异需求所确定出的第一损失结果对应的第一损失权重计算信息及第二损失结果对应的第二损失权重计算信息,本发明实施例不做限定。进一步的,第一预测权重计算信息与第二损失权重计算信息相匹配,具体的,第一预测权重计算信息所对应的权重值与第二损失权重计算信息所对应的权重值相一致,本发明实施例不做限定。
207、根据全局特征预测结果、局部特征预测结果、第一预测权重计算信息及第二预测权重计算信息,确定待标签分类数据对应的标签分类结果。
可选的,将全局特征预测结果、局部特征预测结果进行加权求和、特征合并处理得到待标签分类数据对应的标签分类结果,本发明实施例不做限定。
本发明实施例中,针对步骤201-步骤204的其它描述,请参照实施例一中针对步骤101-步骤104的其他详细描述,本发明实施例不再赘述。
可见,实施本发明实施例能够提供一种层级标签分类模型训练方式,根据确定出的局部文本特征训练结果及全局文本特征训练结果确定文本特征损失情况,并根据文本特征损失情况确定层级标签分类模型的训练收敛情况,有利于提高确定出的文本特征损失情况的准确性和可靠性,进而有利于提高层级标签分类模型的训练精准性,从而有利于提高层级标签分类模型的收敛及时性、可靠性和效率,以及还有利于提高层级标签的分类准确性和可靠性;以及,还能够提供标签分类结果确定方式,确定出特征预测结果及相匹配的预测权重计算信息进而确定出待标签分类数据对应的标签分类结果,提高了标签分类结果确定方式的全面性和合理性,提高了一种层级标签分类模型的训练方式的全面性和整体性,进而丰富了基础层级标签分类模型的应用性,从而有利于提高确定出的标签分类结果的准确性和可靠性。
在一个可选的实施例中,待标签分类数据对应的标签分类结果通过以下公式得到:
Figure SMS_22
其中,
Figure SMS_23
为标签分类结果,
Figure SMS_24
为全局特征预测结果,
Figure SMS_25
为局部特征预测结果,
Figure SMS_26
为第一预测权重计算信息对应的第三权重值,
Figure SMS_27
为第二预测权重计算信息对应的第四权重值,第一预测权重计算信息对应的第三权重值与预先确定出的标签特征差异需求所确定出的损失权重计算信息对应的权重值相匹配。
可选的,
Figure SMS_28
可以设定为0.5,也可以设定为其他值,本发明实施例不做限定。
可见,该可选的实施例提供标签分类结果计算公式,有利于提高标签分类结果确定方式的科学性,进而有利于提高标签分类结果的准确性和可靠性。
实施例三
请参阅图3,图3是本发明实施例公开的一种层级标签分类模型的训练装置的结构示意图。其中,图3所描述的装置可以包括服务器,其中,服务器包括本地服务器或者云服务器,本发明实施例不做限定。如图3所示,该一种层级标签分类模型的训练装置可以包括:
特征获取模块301,用于基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果。
损失确定模块302,用于根据局部文本特征训练结果、全局文本特征训练结果及预设的文本特征损失确定条件,确定基础层级标签分类模型的文本特征损失情况。
判断模块303,用于根据文本特征损失情况,判断基础层级标签分类模型是否满足预设的模型训练收敛条件。
确定模块304,用于当判断模块303判断出基础层级标签分类模型满足模型训练收敛条件时,确定训练后的基础层级标签分类模型收敛,收敛后的基础层级标签分类模型用于确定待标签分类文本的层级标签。
可见,实施图3所描述的一种层级标签分类模型的训练装置能够提供一种层级标签分类模型训练方式,根据确定出的局部文本特征训练结果及全局文本特征训练结果确定文本特征损失情况,并根据文本特征损失情况确定层级标签分类模型的训练收敛情况,有利于提高确定出的文本特征损失情况的准确性和可靠性,进而有利于提高层级标签分类模型的训练精准性,从而有利于提高层级标签分类模型的收敛及时性、可靠性和效率,以及还有利于提高层级标签的分类准确性和可靠性。
在一个可选的实施例中,特征获取模块301基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果的方式具体包括:
将预先确定出的训练数据输入至基础层级标签分类模型所包括的第一变量提取层集合中进行分析,得到中间变量结果集合,并根据中间变量结果集合及预设的第一拼接处理条件,确定训练数据对应的全局文本特征训练结果;
基于中间变量结果集合对基础层级标签分类模型进行训练,得到基础层级标签分类模型输出的局部文本特征训练结果;
其中,中间变量结果集合所对应的中间变量数量与第一变量提取层集合所对应的第一变量提取层数量相匹配。
可见,实施图4所描述的装置能够根据训练数据及第一变量提取层集合确定出中间变量结果集合,并根据中间变量结果集合确定出全局文本特征训练结果及局部文本特征训练结果,有利于提高文本特征训练结果确定方式的合理性,进而有利于提高确定出的文本特征训练结果的准确性和可靠性,以及还提供一种中间变量结果集合拼接处理方式得到全局文本特征训练结果,有利于提高全局文本特征训练结果确定方式的全面性和合理性,进而有利于提高全局文本特征训练结果的确定准确性和确定效率。
在另一个可选的实施例中,特征获取模块301基于中间变量结果集合对基础层级标签分类模型进行训练,得到基础层级标签分类模型输出的局部文本特征训练结果的方式具体包括:
将中间变量结果输入至基础层级标签分类模型所包括的第二变量提取层集合中进行分析,得到层级变量结果集合;
根据层级变量结果集合及预设的第二拼接处理条件,确定训练数据对应的局部文本特征训练结果;
其中,层级变量结果集合所对应的层级变量结果数量与第二变量提取层集合所对应的第二变量提取层数量相匹配。
可见,实施图4所描述的装置还能够根据中间变量结果及第二变量提取层集合确定出层级变量结果集合,并根据层级变量结果集合及第二拼接处理条件确定局部文本特征训练结果,有利于提高局部文本特征训练结果确定方式的全面性和合理性,进而有利于提高确定出的局部文本特征训练结果的准确性和可靠性。
在又一个可选的实施例中,损失确定模块302根据局部文本特征训练结果、全局文本特征训练结果及预设的文本特征损失确定条件,确定基础层级标签分类模型的文本特征损失情况的方式具体包括:
根据全局文本特征训练结果及预设的训练数据对应的真实文本特征,确定第一训练特征损失结果,并根据局部文本特征训练结果及真实文本特征,确定第二训练特征损失结果;
根据第一训练特征损失结果及第二训练特征损失结果,确定第一损失结果;
根据局部文本特征训练结果、全局文本特征训练结果及预设的欧式距离分析条件,确定第二损失结果;
根据第一损失结果及第二损失结果,确定文本特征损失情况。
可见,实施图4所描述的装置还能够根据真实文本特征比对条件确定出第一损失结果并根据欧式距离分析条件确定出第二损失结果,进而根据第一损失结果及第二损失结果确定出文本特征损失情况,有利于提高损失结果确定方式的灵活性和全面性,进而有利于提高确定出的损失结果的准确性和可靠性,以及还有利于提高文本特征损失情况确定方式的全面性,从而有利于提高确定出的文本特征损失情况的准确性和可靠性。
在又一个可选的实施例中,损失确定模块302根据局部文本特征训练结果、全局文本特征训练结果及预设的欧式距离分析条件,确定第二损失结果的方式具体包括:
根据局部文本特征训练结果,从预构建的第一标签数据集中筛选出满足预设的第一层级匹配度筛选条件的第一父类标签及第一子类标签,并根据第一父类标签、第一子类标签及预设的标签映射处理条件,确定第一父类特征及第一子类特征;
根据全局文本特征训练结果,从预构建的第二标签数据集中筛选出满足预设的第二层级匹配度筛选条件的第二父类标签及第二子类标签,并根据第二父类标签、第二子类标签及标签映射处理条件,确定第二父类特征及第二子类特征;
根据第一父类特征、第一子类特征及预设的欧式距离计算条件,确定第一欧式距离结果,并根据第二父类特征、第二子类特征及欧式距离计算条件,确定第二欧式距离结果;
根据第一欧式距离结果及第二欧式距离结果,确定第二损失结果。
可见,实施图4所描述的装置还能够根据层级匹配度筛选条件及标签映射处理条件确定父类特征及子类特征,并根据父类特征、子类特征及欧式距离计算条件确定欧式距离结果进而确定出第二损失结果,有利于提高第二损失结果确定方式的全面性和合理性,进而有利于提高确定出的第二损失结果的准确性和可靠性。
在又一个可选的实施例中,损失确定模块302根据第一损失结果及第二损失结果,确定文本特征损失情况的方式具体包括:
根据预先确定出的标签特征差异需求,确定第一损失结果对应的第一损失权重计算信息及第二损失结果对应的第二损失权重计算信息;
根据第一损失结果、第二损失结果、第一损失权重计算信息及第二损失权重计算信息,确定文本特征损失情况。
在上述可选的实施例中,文本特征损失情况通过以下公式得到:
Figure SMS_29
其中,loss为文本特征损失情况,losscls为第一损失结果,losshierar为第二损失结果,
Figure SMS_30
为第一损失权重计算信息对应的第一权重值,
Figure SMS_31
为第二损失权重计算信息对应的第二权重值。
可见,实施图4所描述的装置还能够确定出不同损失结果所对应的损失权重计算信息并根据损失结果及相应的损失权重计算信息确定出文本特征损失情况,有利于提高文本特征损失情况确定方式的全面性和合理性,进而有利于提高确定出的文本特征损失情况的准确性和可靠性;以及,还能够提供文本特征损失情况计算公式,提高了文本特征损失情况确定方式的科学性和合理性,进而有利于提高确定出的文本特征损失情况的准确性和可靠性。
在又一个可选的实施例中,特征获取模块301,还用于将待标签分类数据输入至训练收敛的基础层级标签分类模型中进行分析,得到待标签分类数据的全局特征预测结果及局部特征预测结果。
确定模块304,还用于根据预先确定出的标签特征差异需求所确定出的损失权重计算信息,确定全局特征预测结果对应的第一预测权重计算信息及局部特征预测结果对应的第二预测权重计算信息。
如图4所示,该装置还可以包括:
层级标签确定模块305,用于根据全局特征预测结果、局部特征预测结果、第一预测权重计算信息及第二预测权重计算信息,确定待标签分类数据对应的标签分类结果。
在上述可选的实施例中,待标签分类数据对应的标签分类结果通过以下公式得到:
Figure SMS_32
其中,
Figure SMS_33
为标签分类结果,
Figure SMS_34
为全局特征预测结果,
Figure SMS_35
为局部特征预测结果,
Figure SMS_36
为第一预测权重计算信息对应的第三权重值,
Figure SMS_37
为第二预测权重计算信息对应的第四权重值,第一预测权重计算信息对应的第三权重值与预先确定出的标签特征差异需求所确定出的损失权重计算信息对应的权重值相匹配。
可见,实施图4所描述的装置还能够提供标签分类结果确定方式,确定出特征预测结果及相匹配的预测权重计算信息进而确定出待标签分类数据对应的标签分类结果,提高了标签分类结果确定方式的全面性和合理性,提高了一种层级标签分类模型的训练方式的全面性和整体性,进而丰富了基础层级标签分类模型的应用性,从而有利于提高确定出的标签分类结果的准确性和可靠性;以及,还能够提供标签分类结果计算公式,有利于提高标签分类结果确定方式的科学性,进而有利于提高标签分类结果的准确性和可靠性。
实施例四
请参阅图5,图5是本发明实施例公开的又一种层级标签分类模型的训练装置的结构示意图。其中,图5所描述的装置可以包括服务器,其中,服务器包括本地服务器或者云服务器,本发明实施例不做限定。如图5所示,该装置可以包括:
存储有可执行程序代码的存储器401;
与存储器401耦合的处理器402;
进一步的,还可以包括与处理器402耦合的输入接口403以及输出接口404;
其中,处理器402调用存储器401中存储的可执行程序代码,用于执行实施例一或实施例二所描述的一种层级标签分类模型的训练方法中的步骤。
实施例五
本发明实施例公开了一种计算机存储介质,其存储用于电子数据交换的计算机程序,其中,该计算机程序使得计算机执行实施例一或实施例二所描述的一种层级标签分类模型的训练方法中的步骤。
实施例六
本发明实施例公开了一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行实施例一或实施例二所描述的一种层级标签分类模型的训练方法中的步骤。
以上所描述的装置实施例仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施例的具体描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
最后应说明的是:本发明实施例公开的一种层级标签分类模型的训练方法及装置所揭露的仅为本发明较佳实施例而已,仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各项实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应的技术方案的本质脱离本发明各项实施例技术方案的精神和范围。

Claims (10)

1.一种层级标签分类模型的训练方法,其特征在于,所述方法包括:
基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果;
根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的文本特征损失确定条件,确定所述基础层级标签分类模型的文本特征损失情况;
根据所述文本特征损失情况,判断所述基础层级标签分类模型是否满足预设的模型训练收敛条件;
当判断结果为是时,确定训练后的所述基础层级标签分类模型收敛,收敛后的所述基础层级标签分类模型用于确定待标签分类文本的层级标签。
2.根据权利要求1所述的一种层级标签分类模型的训练方法,其特征在于,所述基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果,包括:
将预先确定出的训练数据输入至基础层级标签分类模型所包括的第一变量提取层集合中进行分析,得到中间变量结果集合,并根据所述中间变量结果集合及预设的第一拼接处理条件,确定所述训练数据对应的全局文本特征训练结果;
基于所述中间变量结果集合对所述基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果;
其中,所述中间变量结果集合所对应的中间变量数量与所述第一变量提取层集合所对应的第一变量提取层数量相匹配。
3.根据权利要求2所述的一种层级标签分类模型的训练方法,其特征在于,所述基于所述中间变量结果集合对所述基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果,包括:
将所述中间变量结果输入至所述基础层级标签分类模型所包括的第二变量提取层集合中进行分析,得到层级变量结果集合;
根据所述层级变量结果集合及预设的第二拼接处理条件,确定所述训练数据对应的局部文本特征训练结果;
其中,所述层级变量结果集合所对应的层级变量结果数量与所述第二变量提取层集合所对应的第二变量提取层数量相匹配。
4.根据权利要求1-3任一项所述的一种层级标签分类模型的训练方法,其特征在于,所述根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的文本特征损失确定条件,确定所述基础层级标签分类模型的文本特征损失情况,包括:
根据所述全局文本特征训练结果及预设的所述训练数据对应的真实文本特征,确定第一训练特征损失结果,并根据所述局部文本特征训练结果及所述真实文本特征,确定第二训练特征损失结果;
根据所述第一训练特征损失结果及所述第二训练特征损失结果,确定第一损失结果;
根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的欧式距离分析条件,确定第二损失结果;
根据所述第一损失结果及所述第二损失结果,确定文本特征损失情况。
5.根据权利要求4所述的一种层级标签分类模型的训练方法,其特征在于,所述根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的欧式距离分析条件,确定第二损失结果,包括:
根据所述局部文本特征训练结果,从预构建的第一标签数据集中筛选出满足预设的第一层级匹配度筛选条件的第一父类标签及第一子类标签,并根据所述第一父类标签、所述第一子类标签及预设的标签映射处理条件,确定第一父类特征及第一子类特征;
根据所述全局文本特征训练结果,从预构建的第二标签数据集中筛选出满足预设的第二层级匹配度筛选条件的第二父类标签及第二子类标签,并根据所述第二父类标签、所述第二子类标签及所述标签映射处理条件,确定第二父类特征及第二子类特征;
根据所述第一父类特征、所述第一子类特征及预设的欧式距离计算条件,确定第一欧式距离结果,并根据所述第二父类特征、所述第二子类特征及所述欧式距离计算条件,确定第二欧式距离结果;
根据所述第一欧式距离结果及所述第二欧式距离结果,确定第二损失结果。
6.根据权利要求4所述的一种层级标签分类模型的训练方法,其特征在于,所述根据所述第一损失结果及所述第二损失结果,确定文本特征损失情况,包括:
根据预先确定出的标签特征差异需求,确定所述第一损失结果对应的第一损失权重计算信息及所述第二损失结果对应的第二损失权重计算信息;
根据所述第一损失结果、所述第二损失结果、所述第一损失权重计算信息及所述第二损失权重计算信息,确定文本特征损失情况;
以及,所述文本特征损失情况通过以下公式得到:
Figure QLYQS_1
其中,loss为所述文本特征损失情况,losscls为所述第一损失结果,losshierar为所述第二损失结果,
Figure QLYQS_2
为所述第一损失权重计算信息对应的第一权重值,
Figure QLYQS_3
为所述第二损失权重计算信息对应的第二权重值。
7.根据权利要求1所述的一种层级标签分类模型的训练方法,其特征在于,所述方法还包括:
将待标签分类数据输入至训练收敛的所述基础层级标签分类模型中进行分析,得到所述待标签分类数据的全局特征预测结果及局部特征预测结果,并根据预先确定出的标签特征差异需求所确定出的损失权重计算信息,确定所述全局特征预测结果对应的第一预测权重计算信息及所述局部特征预测结果对应的第二预测权重计算信息;
根据所述全局特征预测结果、所述局部特征预测结果、所述第一预测权重计算信息及所述第二预测权重计算信息,确定所述待标签分类数据对应的标签分类结果;
以及,所述待标签分类数据对应的标签分类结果通过以下公式得到:
Figure QLYQS_4
其中,
Figure QLYQS_5
为所述标签分类结果,
Figure QLYQS_6
为全局特征预测结果,
Figure QLYQS_7
为所述局部特征预测结果,
Figure QLYQS_8
为所述第一预测权重计算信息对应的第三权重值,
Figure QLYQS_9
为所述第二预测权重计算信息对应的第四权重值,所述第一预测权重计算信息对应的第三权重值与预先确定出的标签特征差异需求所确定出的损失权重计算信息对应的权重值相匹配。
8.一种层级标签分类模型的训练装置,其特征在于,所述装置包括:
特征获取模块,用于基于预先确定出的训练数据对基础层级标签分类模型进行训练,得到所述基础层级标签分类模型输出的局部文本特征训练结果及全局文本特征训练结果;
损失确定模块,用于根据所述局部文本特征训练结果、所述全局文本特征训练结果及预设的文本特征损失确定条件,确定所述基础层级标签分类模型的文本特征损失情况;
判断模块,用于根据所述文本特征损失情况,判断所述基础层级标签分类模型是否满足预设的模型训练收敛条件;
确定模块,用于当所述判断模块判断出所述基础层级标签分类模型满足所述模型训练收敛条件时,确定训练后的所述基础层级标签分类模型收敛,收敛后的所述基础层级标签分类模型用于确定待标签分类文本的层级标签。
9.一种层级标签分类模型的训练装置,其特征在于,所述装置包括:
存储有可执行程序代码的存储器;
与所述存储器耦合的处理器;
所述处理器调用所述存储器中存储的所述可执行程序代码,执行如权利要求1-7任一项所述的一种层级标签分类模型的训练方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7任一项所述的一种层级标签分类模型的训练方法。
CN202310193427.7A 2023-03-03 2023-03-03 一种层级标签分类模型的训练方法及装置 Pending CN115878808A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310193427.7A CN115878808A (zh) 2023-03-03 2023-03-03 一种层级标签分类模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310193427.7A CN115878808A (zh) 2023-03-03 2023-03-03 一种层级标签分类模型的训练方法及装置

Publications (1)

Publication Number Publication Date
CN115878808A true CN115878808A (zh) 2023-03-31

Family

ID=85761817

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310193427.7A Pending CN115878808A (zh) 2023-03-03 2023-03-03 一种层级标签分类模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN115878808A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590815A (zh) * 2021-06-15 2021-11-02 杭州费尔斯通科技有限公司 一种层级性多元标签文本分类的方法和系统
CN113705685A (zh) * 2021-08-30 2021-11-26 平安科技(深圳)有限公司 疾病特征识别模型训练、疾病特征识别方法、装置及设备
WO2022156065A1 (zh) * 2021-01-21 2022-07-28 平安科技(深圳)有限公司 一种文本情感分析方法、装置、设备及存储介质
CN114912433A (zh) * 2022-05-25 2022-08-16 亚信科技(中国)有限公司 文本层级多标签分类方法、装置、电子设备以及存储介质
CN115238104A (zh) * 2022-06-28 2022-10-25 有米科技股份有限公司 信息层级分类模型的构建方法及装置
CN115577106A (zh) * 2022-10-14 2023-01-06 北京百度网讯科技有限公司 基于人工智能的文本分类方法、装置、设备和介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022156065A1 (zh) * 2021-01-21 2022-07-28 平安科技(深圳)有限公司 一种文本情感分析方法、装置、设备及存储介质
CN113590815A (zh) * 2021-06-15 2021-11-02 杭州费尔斯通科技有限公司 一种层级性多元标签文本分类的方法和系统
CN113705685A (zh) * 2021-08-30 2021-11-26 平安科技(深圳)有限公司 疾病特征识别模型训练、疾病特征识别方法、装置及设备
CN114912433A (zh) * 2022-05-25 2022-08-16 亚信科技(中国)有限公司 文本层级多标签分类方法、装置、电子设备以及存储介质
CN115238104A (zh) * 2022-06-28 2022-10-25 有米科技股份有限公司 信息层级分类模型的构建方法及装置
CN115577106A (zh) * 2022-10-14 2023-01-06 北京百度网讯科技有限公司 基于人工智能的文本分类方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN108345587B (zh) 一种评论的真实性检测方法与系统
CN112084383A (zh) 基于知识图谱的信息推荐方法、装置、设备及存储介质
CN112328909B (zh) 信息推荐方法、装置、计算机设备及介质
CN112084793B (zh) 基于依存句法的语义识别方法、设备和可读存储介质
CN111858843B (zh) 一种文本分类方法及装置
CN111831826A (zh) 跨领域的文本分类模型的训练方法、分类方法以及装置
CN112183672A (zh) 图像分类方法、特征提取网络的训练方法和装置
CN115100582B (zh) 基于多模态数据的模型训练方法及装置
CN114065702A (zh) 一种融合实体关系和事件要素的事件检测方法
CN115238104A (zh) 信息层级分类模型的构建方法及装置
CN113591881B (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN114817633A (zh) 视频分类方法、装置、设备及存储介质
CN112383821B (zh) 相似视频的智能化合并方法及装置
CN113221216A (zh) Bim的数据校验方法、装置、电子设备及存储介质
CN115935279A (zh) 一种层级分类模型的训练、层级分类的方法及装置
CN116975400A (zh) 一种数据分级分类方法、装置、电子设备及存储介质
CN115878808A (zh) 一种层级标签分类模型的训练方法及装置
CN116756281A (zh) 知识问答方法、装置、设备和介质
CN114821062A (zh) 基于图像分割的商品识别方法及装置
CN114513578A (zh) 外呼方法、装置、计算机设备及存储介质
CN114115878A (zh) 一种工作流节点推荐方法及装置
CN113722584A (zh) 任务推送方法、装置及存储介质
CN115238150A (zh) 基于层级分类模型的信息分类方法及装置
CN110399984A (zh) 一种信息的预测方法、系统以及电子设备
CN118519916B (zh) 一种gui测试用例生成方法、计算机程序及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20230331

RJ01 Rejection of invention patent application after publication