WO2021151296A1

WO2021151296A1 - 多任务分类方法、装置、计算机设备及存储介质

Info

Publication number: WO2021151296A1
Application number: PCT/CN2020/118888
Authority: WO
Inventors: 郑立颖; 徐亮
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-07-22
Filing date: 2020-09-29
Publication date: 2021-08-05
Also published as: CN111881968A; CN111881968B

Abstract

一种多任务分类方法、装置、计算机设备及存储介质，该方法包括：获取训练样本及任务标签（S11）；检测训练样本是否为单一任务训练样本（S12）；当检测结果为是时，确定初始第一多任务学习模型中目标网络主体，并对所述训练样本进行训练，得到目标第一多任务学习模型（S13）；当检测结果为否时，确定初始第二多任务学习模型中目标分类器，并对对应的训练样本进行训练，得到目标第二多任务学习模型（S14）；基于目标第一多任务学习模型或者目标第二多任务学习模型对待分类任务进行分类并输出分类结果（S15）。该方法能够针对子任务语料不多的情况，提高各个子任务的模型处理效果及处理效率。

Description

多任务分类方法、装置、计算机设备及存储介质

本申请要求于2020年07月22日提交中国专利局、申请号为CN 202010713422.9、名称为“多任务分类方法、装置及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种多任务分类方法、装置、计算机设备及存储介质。

背景技术

随着人工智能技术的发展，越来越多的应用领域大量使用人工智能模型执行任务处理。现有技术中利用人工智能模型进行任务处理时，对于每个单独的任务需要单独训练一个模型。例如，在智能面试时，存在能力评估、简历识别及智能回答等多个子任务，需要针对这多个子任务训练多个模型。

技术问题

发明人意识到，各个子任务的语料数量并不多，导致针对每一子任务单独训练模型的效果不佳，模型处理效率较低。因此，如何在子任务语料不多时，提高各个子任务的模型处理效率成为亟待解决的问题。

技术解决方案

本申请实施例第一方面提供一种多任务分类方法，所述多任务分类模型训练方法包括：

获取训练样本及所述训练样本的任务标签；

检测所述训练样本是否为单一任务训练样本；

当检测结果为所述训练样本为单一任务训练样本时，确定初始第一多任务学习模型中与所述任务标签对应的目标网络主体，基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型；

当检测结果为所述训练样本为多任务训练样本时，确定初始第二多任务学习模型中与每个任务训练样本的任务标签对应的目标分类器，基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型；

基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果。

本申请实施例第二方面还提供一种多任务分类装置，所述多任务分类模型训练装置包括：

样本获取模块，用于获取训练样本及所述训练样本的任务标签；

样本检测模块，用于检测所述训练样本是否为单一任务训练样本；

第一模型获取模块，用于当检测结果为所述训练样本为单一任务训练样本时，确定初始第一多任务学习模型中与所述任务标签对应的目标网络主体，基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型；

第二模型获取模块，用于当检测结果为所述训练样本为多任务训练样本时，确定初始第二多任务学习模型中与每个任务训练样本的任务标签对应的目标分类器，基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型；

分类处理模块，基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果。

本申请实施例第三方面还提供一种计算机设备，所述计算机设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现以下步骤：

获取训练样本及所述训练样本的任务标签；

检测所述训练样本是否为单一任务训练样本；

本申请实施例第四方面还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取训练样本及所述训练样本的任务标签；

检测所述训练样本是否为单一任务训练样本；

附图说明

图1是本申请第一实施方式提供的多任务分类方法的流程图。

图2是本申请一实施方式的计算机设备的结构示意图。

图3是图2所示的计算机设备的示例性的功能模块图。

如下具体实施方式将结合上述附图进一步说明本申请。

本发明的实施方式

为了能够更清楚地理解本申请的上述目的、特征和优点，下面结合附图和具体实施例对本申请进行详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本申请，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请。

请参阅图1，图1是本申请第一实施方式提供的多任务分类方法的流程图。所述多任务分类方法可以应用于智能面试场景，如图1所示，所述多任务分类方法可以包括如下步骤：

S11、获取训练样本及所述训练样本的任务标签。

在本申请的至少一实施例中，所述训练样本用于训练人工神经网络模型的，所述训练样本的具体类型可根据任务的实际情况而定。所述训练样本包括单一任务训练样本与多任务训练样本，所述单一任务训练样本为仅包含一个任务的训练样本，所述多任务训练样本为包含多个任务的训练样本。在一实施例中，多个任务可以是对于同一数据进行不同处理的任务，并且多个任务的处理结果之间可以互不影响。所述训练样本包括文本语料、类别标签与任务标签，所述类别标签与任务标签可以是人工标注的，或者通过其他方式获得的。所述类别标签用于标识当前训练样本的输出类别，所述任务标签用于标识当前训练样本的所属任务。

在本申请的至少一实施例中，为提高模型训练效率，所述训练样本按照预设样本格式设置，所述任务标签设定于指定位置。获取所述单一任务训练样本的任务标签可以包括：确定所述训练样本的预定位置；获取所述预定位置处的标签为任务标签。

在本申请的至少一实施例中，当所述多任务分类方法应用于智能面试场景时，所述训练样本可以为心态积极程度评分数据、面试者问答匹配数据以及简历识别数据等。通过所述心态积极程度评分数据能够确定面试者的心态积极程度，通过面试者问答匹配数据能够针对面试者的提问智能匹配出答案，通过简历识别数据能够确定面试者的个人简历信息。

示例性地，当所述训练样本为单一任务训练样本时，所述单一任务训练样本可以由128个心态积极程度评分数据或者128个简历识别数据。当所述训练样本为多任务训练样本时，所述多任务训练样本可以由64个心态积极程度评分数据与64个面试者问答匹配数据组成，并且随机打乱样本的顺序。上述训练样本可根据实际需求设置，在此不作限制。

S12、检测所述训练样本是否为单一任务训练样本，当检测结果为所述训练样本为单一任务训练样本时，执行步骤S13；当检测结果为所述训练样本为多任务训练样本时，执行步骤S14。

在本申请的至少一实施例中，针对不同类型的训练样本，设置有对应的多任务学习模型。例如，针对单一任务训练样本，可设置第一多任务学习模型；针对多任务训练样本，可以设置第二多任务学习模型。通过对不同类型的训练样本，设置相应的多任务学习模型，能够提高模型处理效果及处理速率。

在本申请的至少一实施例中，所述检测所述训练样本是否为单一任务训练样本包括：获取所述训练样本的任务标签；检测所述任务标签是否一致；当检测结果为所述任务标签不一致时，确定所述训练样本为多任务训练样本；当检测结果为所述任务标签一致时，确定所述训练样本为单一任务训练样本。

S13、确定初始第一多任务学习模型中与所述任务标签对应的目标网络主体，基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型。

在本申请的至少一实施例中，训练开始时，可以为初始化的第一多任务学习模型，之后将训练样本输入至所述初始第一多任务学习模型中，最终得到一个输出结果，训练人工神经网络模型的目的是为了使得人工神经网络模型的输出结果与该训练样本对应的类别标签无限接近。初始训练时，由于模型参数是人为初始化得到的，输出结果与类别标签的相差较大，因此每次得到输出结果后，可以将输出结果与类别标签代入预先设定好的损失函数计算得到一个损失值，之后再利用损失值对模型参数进行更新，在利用大量的训练样本重复迭代上述过程后，最终会得到能够使得人工神经网络模型的输出结果与类别标签很接近的一组模型相关参数。

在本申请的至少一实施例中，所述初始第一多任务学习模型包括网络交互层、若干个网络主体与第一分类器，所述网络主体与所述第一分类器的数量一致，所述网络交互层为多个网络主体共享的交互层。本申请以网络主体的数量为2个举例，在所述第一多任务学习模型中，所述网络交互层前的网络主体1与网络主体2均为第一嵌入层（embedding层），所述网络交互层之后的网络主体1与网络主体2均为第一预设编码器，所述第一预设编码器包括2层transformer编码器或2层bilstm编码器，优选地，当子任务为序列标注任务时，所述第一预设编码器可以为2层bilstm编码器。所述第一预设编码层之后为对应的第一分类器。

在本申请的至少一实施例中，所述第一嵌入层可用于对所述训练样本进行向量表征处理，得到每个训练样本的语义表征向量；所述网络交互层可用于计算所述语义表征向量的注意力权值（attention值）；所述第一预设编码器可用于对所述语义表征向量进行语义识别处理，得到语义特征向量；所述第一分类器可用于对所述语义特征向量进行分类处理，得到分类预测结果。

在本申请的至少一实施例中，所述任务标签与所述初始第一多任务学习模型的目标网络主体与目标第一分类器相对应，所述任务标签与所述网络主体、所述目标第一分类器间的关系可通过映射表表示，通过查询该映射表，能够确定与所述任务标签对应的所述初始第一多任务学习模型的目标网络主体与目标第一分类器。

在本申请的至少一实施例中，基于所述目标网络主体对所述训练样本进行训练，得到对应所述任务标签的目标第一多任务学习模型。其中，所述基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型包括：利用所述训练样本自底向上对所述网络交互层及所述目标网络主体进行训练得到第一网络交互层参数及第一网络主体参数；利用反向传播算法更新所述第一网络交互层参数得到第二网络交互参数，及更新所述第一网络主体参数得到第二网络主体参数；基于所述第二网络交互参数及所述第二网络主体参数得到对应所述任务标签的目标第一多任务学习模型。其中，模型的相关参数存储于区块链中。

优选地，所述利用所述训练样本自底向上对所述网络交互层及所述目标网络主体进行训练得到第一网络交互层参数及第一网络主体参数包括：调用对应所述目标网络主体的第一嵌入层对所述训练样本进行向量表征处理，得到每个训练样本的语义表征向量；调用所述网络交互层计算所述语义表征向量的注意力权值；根据所述注意力权值调用第一预设编码器对所述语义表征向量进行语义识别处理，得到语义特征向量，所述第一预设编码器包括2层transformer编码器或2层BiLstm编码器；调用所述目标第一分类器对所述语义特征向量进行训练得到第一网络交互层参数及第一网络主体参数。

示例性地，当单一任务为心态积极程度评分时，对于网络主体1，所述单一任务训练样本可以为128个心态积极程度评分数据；当单一任务为简历识别时，对于网络主体2，所述单一任务训练样本可以为128个简历识别数据。两个单一任务调用第一多任务学习模型进行交替训练。例如，当所述单一任务训练样本为心态积极程度评分数据时，本次只迭代更新网络主体1与所述网络交互层的参数，网络主体2的参数保持不变。当所述单一任务训练样本为简历识别数据时，本次只迭代更新网络主体2与所述网络交互层的参数，网络主体1的参数保持不变。

S14、确定初始第二多任务学习模型中与每个任务训练样本的任务标签对应的目标分类器，基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型。

在本申请的至少一实施例中，当检测结果为所述训练样本为多任务训练样本时，所述方法还包括：获取所述训练样本的任务标签；调用初始第二多任务学习模型，所述初始第二多任务学习模型包括输入层、第二嵌入层、第二预设编码器及若干第二分类器；根据所述任务标签确定目标分类器；基于所述目标分类器对对应的训练样本进行训练，得到对应所述任务标签的目标第二多任务学习模型。其中，所述第二嵌入层可用于对所述训练样本进行向量表征处理，得到每个训练样本的语义表征向量；所述第二预设编码器可用于对所述语义表征向量进行语义识别处理，得到对应不同第二分类器的语义特征向量；所述第二分类器可用于对所述语义特征向量进行分类处理，得到分类预测结果。所述第二预设编码器可以为2层transformer编码器。

在本申请的至少一实施例中，所述基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型包括：利用所述训练样本自底向上对所述第二分类器进行训练得到第第二分类器参数；利用反向传播算法更新所述第二分类器参数得到第三分类器参数；基于所述第三分类器参数得到对应所述任务标签的目标第二多任务学习模型。

在本申请的至少一实施例中，在选定了多任务学习模型后，可以根据人工神经网络模型的训练算法对所述训练样本进行处理，并不断更新迭代相关模型参数，最终在迭代次数达到一定数量，或者相关模型参数呈收敛状态时，可以停止多任务学习模型的训练，进而得到训练好的多任务学习模型，也即得到优化好的多任务学习模型的相关模型参数。其中，所述相关模型参数包括共享参数与任务参数，所述共享参数可以为多个任务共同享有的参数，所述任务参数可以为单个任务独有的参数。

优选地，在所述得到目标第一多任务学习模型或者所述目标第二多任务学习模型之前，所述方法还包括：获取测试样本；将所述测试样本输入至更新完参数的第一多任务学习模型或者第二多任务学习模型，得到分类测试结果；根据所述分类测试结果计算损失值；检测所述损失值是否处于预设损失范围；当检测结果为所述损失值处于预设损失范围时，将训练得到的模型作为目标第一多任务学习模型或者目标第二多任务学习模型。其中，可以通过调用相关损失函数的方式计算分类测试结果的损失值，所述预设损失范围为预先设置的。

S15、基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果。

在本申请的至少一实施例中，所述基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果包括：检测所述待分类任务是否为单一分类任务；当检测结果为所述待分类任务为单一分类任务时，调用所述目标第一多任务学习模型对所述待分类任务进行分类并输出分类结果；当检测结果为所述待分类任务时，调用所述目标第二多任务学习模型对所述待分类任务进行分类并输出分类结果。

在本申请的至少一实施例中，所述待分类任务可以包括心态积极程度评分任务、简历识别任务以及面试者问答匹配任务。所述待分类任务可以为单一分类任务或多分类任务。例如，对于多分类任务来说，所述待分类任务包括随机排序的心态积极程度评分任务与面试者问答匹配任务。对于单一分类任务来说，所述待分类任务包括单一的心态积极程度评分任务或单一的简历识别任务。

在本申请的至少一实施例中，所述调用所述目标第一多任务学习模型进行分类并输出分类结果包括：输入所述待分类任务；调用对应所述目标网络主体的第一嵌入层对所述待分类任务进行向量表征处理，得到每个待分类任务的语义表征向量；调用所述网络交互层计算所述语义表征向量的注意力权值；根据所述注意力权值调用第一预设编码器对所述语义表征向量进行语义识别处理，得到语义特征向量，所述第一预设编码器包括2层transformer编码器或2层BiLstm编码器；调用所述目标第一分类器对所述语义特征向量进行分类处理，得到分类结果。

在本申请的至少一实施例中，同一批次包含的单一分类任务的类别可能为1个，也可能为多个。对于包含多个类别的单一分类任务，可以通过交替调用所述目标第一多任务学习模型的方式进行任务处理。示例性地，多个类别的单一分类任务包括单一的心态积极程度评分任务或单一的简历识别任务，所述单一的心态积极程度评分任务与网络主体1对应，所述单一的简历识别任务与网络主体2对应。对于单一的心态积极程度评分任务，可以调用所述目标第一多任务学习模型中的网络主体1、网络交互层及分类器1处理该数据，得到面试者的心态积极程度分值，面试者的心态积极程度从低到高的分值范围可以为[1,2,3]。对于单一的简历识别任务，可以调用所述目标第一多任务学习模型中的网络主体2、网络交互层及分类器2处理该数据，得到简历文本的序列标注，所述简历文本的序列标注可以包括公司名、学校名及专业等。

在本申请的至少一实施例中，所述调用所述目标第二多任务学习模型对所述待分类任务进行分类并输出分类结果包括：调用所述输入层接收所述训练样本；调用第二嵌入层对所述训练样本进行向量表征处理，得到每个训练样本的语义表征向量；调用第二预设编码器对所述语义表征向量进行语义识别处理，得到对应不同第二分类器的多个语义特征向量；调用所述第二分类器对所述语义特征向量进行分类处理，得到分类预测结果。

在本申请的至少一实施例中，对于多分类任务来说，所述待分类任务可以包括随机排序的心态积极程度评分任务与面试者问答匹配任务。所述心态积极程度评分任务与分类器1对应，所述面试者问答匹配任务与分类器2对应。将所述多分类任务输入至所述目标第二多任务学习模组，并通过相应的分类器进行任务处理。示例性地，通过分类器1能够得到面试者的心态积极程度分值，面试者的心态积极程度从低到高的分值范围可以为[1,2,3]。通过分类器2能够得到面试者问答匹配数据，面试者问答匹配数据的分类序号范围为[1,10]。

本申请提供的多任务处理方法，通过对不同类型的待分类任务，设置相应的多任务学习模型，能够提高模型处理速率，进而提高待分类任务的速率；此外，本申请能够针对子任务语料不多的情况，采用多任务学习共享网络的方式，提高各个子任务的模型处理效果及处理效率。

以上是对本申请实施例所提供的方法进行的详细描述。根据不同的需求，所示流程图中方块的执行顺序可以改变，某些方块可以省略。下面对本申请实施例所提供的计算机设备1进行描述。

图2是本申请一实施方式的计算机设备的结构示意图，如图2所示，计算机设备1包括存储器10，存储器10中存储有所述多任务分类装置100。所述计算机设备1可以是计算机、平板电脑、个人数字助理等具有数据处理、分析、程序执行及显示等功能的电子设备。所述多任务分类装置100可以获取训练样本及所述训练样本的任务标签；检测所述训练样本是否为单一任务训练样本；当检测结果为所述训练样本为单一任务训练样本时，确定初始第一多任务学习模型中与所述任务标签对应的目标网络主体，基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型；当检测结果为所述训练样本为多任务训练样本时，确定初始第二多任务学习模型中与每个任务训练样本的任务标签对应的目标分类器，基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型；基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果。通过本申请，能够针对子任务语料不多的情况，提高各个子任务的模型处理效果及处理效率。

本实施方式中，计算机设备1还可以包括显示屏20及处理器30。存储器10、显示屏20可以分别与处理器30电连接。

所述的存储器10可以是不同类型存储设备，用于存储各类数据。例如，可以是计算机设备1的存储器、内存，还可以是可外接于该计算机设备1的存储卡，如闪存、SM卡（Smart Media Card，智能媒体卡）、SD卡（Secure Digital Card，安全数字卡）等。存储器10可以包括非易失性存储器和/或易失性存储器，非易失性存储器例如硬盘、内存、插接式硬盘，智能存储卡（Smart Media Card, SMC），安全数字（Secure Digital, SD）卡，闪存卡（Flash Card）、至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。存储器10用于存储各类数据，例如，所述计算机设备1中安装的各类应用程序（Applications）、应用上述多任务分类方法而设置、获取的数据等信息。

显示屏20安装于计算机设备1，用于显示信息。

处理器30用于执行所述多任务分类方法以及所述计算机设备1内安装的各类软件，例如操作系统及应用显示软件等。处理器30包含但不限于处理器（Central Processing Unit，CPU）、微控制单元(Micro Controller Unit，MCU)等用于解释计算机指令以及处理计算机软件中的数据的装置。

所述的多任务分类装置100可以包括一个或多个的模块，所述一个或多个模块被存储在计算机设备1的存储器10中并被配置成由一个或多个处理器（本实施方式为一个处理器30）执行，以完成本申请实施例。参阅图3所示，所述多任务分类装置100可以包括样本获取模块101、样本检测模块102、第一模型获取模块103、第二模型获取模块104以及分类处理模块105。本申请实施例所称的模块可以是完成一特定功能的程序段，比程序更适合于描述软件在处理器30中的执行过程。

可以理解的是，对应上述多任务分类方法中的各实施方式，多任务分类装置100可以包括图3中所示的各功能模块中的一部分或全部，各模块的功能将在以下具体介绍。需要说明的是，以上多任务分类方法的各实施方式中相同的名词相关名词及其具体的解释说明也可以适用于以下对各模块的功能介绍。为节省篇幅及避免重复起见，在此就不再赘述。

样本获取模块101可以用于获取训练样本。

样本检测模块102可以用于检测所述训练样本是否为单一任务训练样本。

第一模型获取模块103可以用于当检测结果为所述训练样本为单一任务训练样本时，确定初始第一多任务学习模型中与所述任务标签对应的目标网络主体，基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型。

第二模型获取模块104可以用于当检测结果为所述训练样本为多任务训练样本时，确定初始第二多任务学习模型中与每个任务训练样本的任务标签对应的目标分类器，基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型。

分类处理模块105可以基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质可包括非易失性和/或易失性存储器，其上存储有计算机程序，所述计算机程序被处理器30执行时实现上述任一实施方式中的多任务分类方法的步骤。

所述多任务分类装置100/计算机设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施方式方法中的全部或部分流程，也可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器30执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（ROM，Read-Only Memory）等。

所称处理器30可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor，DSP)、专用集成电路 (Application Specific Integrated Circuit，ASIC)、现场可编程门阵列 (Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器30是所述多任务分类装置100/计算机设备1的控制中心，利用各种接口和线路连接整个多任务分类装置100/计算机设备1的各个部分。

所述存储器10用于存储所述计算机程序和/或模块，所述处理器30通过运行或执行存储在所述存储器10内的计算机程序和/或模块，以及调用存储在存储器10内的数据，实现所述多任务分类装置100/计算机设备1的各种功能。所述存储器10可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据计算机设备1的使用所创建的数据等。

在本申请所提供的几个具体实施方式中，应该理解到，所揭露的计算机设备和方法，可以通过其它的方式实现。例如，以上所描述的系统实施方式仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

对于本领域技术人员而言，显然本申请实施例不限于上述示范性实施例的细节，而且在不背离本申请实施例的精神或基本特征的情况下，能够以其他的具体形式实现本申请实施例。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本申请实施例的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请实施例内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。系统、装置或计算机设备权利要求中陈述的多个单元、模块或装置也可以由同一个单元、模块或装置通过软件或者硬件来实现。

以上实施方式仅用以说明本申请实施例的技术方案而非限制，尽管参照以上较佳实施方式对本申请实施例进行了详细说明，本领域的普通技术人员应当理解，可以对本申请实施例的技术方案进行修改或等同替换都不应脱离本申请实施例的技术方案的精神和范围。

Claims

一种多任务分类方法，所述多任务分类模型训练方法包括：

获取训练样本及所述训练样本的任务标签；

检测所述训练样本是否为单一任务训练样本；

当检测结果为所述训练样本为单一任务训练样本时，确定初始第一多任务学习模型中与所述任务标签对应的目标网络主体，基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型；

当检测结果为所述训练样本为多任务训练样本时，确定初始第二多任务学习模型中与每个任务训练样本的任务标签对应的目标分类器，基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型；

基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果。
根据权利要求1所述的多任务分类方法，其中，所述初始第一多任务学习模型包括网络交互层、多个网络主体及与每个网络主体对应的第一分类器，所述基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型包括：

利用所述训练样本自底向上对所述网络交互层及所述目标网络主体进行训练得到第一网络交互层参数及第一网络主体参数；

利用反向传播算法更新所述第一网络交互层参数得到第二网络交互参数，及更新所述第一网络主体参数得到第二网络主体参数；

基于所述第二网络交互参数及所述第二网络主体参数得到对应所述任务标签的目标第一多任务学习模型。
根据权利要求1所述的多任务分类方法，其中，所述初始第二多任务学习模型包括第二分类器，所述基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型包括：

利用所述训练样本自底向上对所述第二分类器进行训练得到第第二分类器参数；

利用反向传播算法更新所述第二分类器参数得到第三分类器参数；

基于所述第三分类器参数得到对应所述任务标签的目标第二多任务学习模型。
根据权利要求2所述的多任务分类方法，其中，所述利用所述训练样本自底向上对所述网络交互层及所述目标网络主体进行训练得到第一网络交互层参数及第一网络主体参数包括：

调用对应所述目标网络主体的第一嵌入层对所述训练样本进行向量表征处理，得到每个训练样本的语义表征向量；

调用所述网络交互层计算所述语义表征向量的注意力权值；

根据所述注意力权值调用第一预设编码器对所述语义表征向量进行语义识别处理，得到语义特征向量，所述第一预设编码器包括2层transformer编码器或2层BiLstm编码器；

调用所述目标第一分类器对所述语义特征向量进行训练得到第一网络交互层参数及第一网络主体参数。
根据权利要求1所述的多任务分类方法，其中，在所述得到目标第一多任务学习模型或者所述目标第二多任务学习模型之前，所述方法还包括：

获取测试样本；

将所述测试样本输入至更新完参数的第一多任务学习模型或者第二多任务学习模型，得到分类测试结果；

根据所述分类测试结果计算损失值；

检测所述损失值是否处于预设损失范围；

当检测结果为所述损失值处于预设损失范围时，将训练得到的模型作为目标第一多任务学习模型或者目标第二多任务学习模型。
根据权利要求1所述的多任务分类方法，其中，所述检测所述训练样本是否为单一任务训练样本包括：

获取所述训练样本的任务标签；

检测所述任务标签是否一致；

当检测结果为所述任务标签不一致时，确定所述训练样本为多任务训练样本；

当检测结果为所述任务标签一致时，确定所述训练样本为单一任务训练样本。
根据权利要求1所述的多任务分类方法，其中，所述基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果包括：

检测所述待分类任务是否为单一分类任务；

当检测结果为所述待分类任务为单一分类任务时，调用所述目标第一多任务学习模型对所述待分类任务进行分类并输出分类结果；

当检测结果为所述待分类任务为多分类任务时，调用所述目标第二多任务学习模型对所述待分类任务进行分类并输出分类结果。
一种多任务分类装置，所述多任务分类模型训练装置包括：

样本获取模块，用于获取训练样本；

样本检测模块，用于检测所述训练样本是否为单一任务训练样本；

第一模型获取模块，用于当检测结果为所述训练样本为单一任务训练样本时，确定初始第一多任务学习模型中与所述任务标签对应的目标网络主体，基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型；

第二模型获取模块，用于当检测结果为所述训练样本为多任务训练样本时，确定初始第二多任务学习模型中与每个任务训练样本的任务标签对应的目标分类器，基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型；

分类处理模块，基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果。
一种计算机设备，所述计算机设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现以下步骤：

获取训练样本及所述训练样本的任务标签；

检测所述训练样本是否为单一任务训练样本；

当检测结果为所述训练样本为单一任务训练样本时，确定初始第一多任务学习模型中与所述任务标签对应的目标网络主体，基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型；

当检测结果为所述训练样本为多任务训练样本时，确定初始第二多任务学习模型中与每个任务训练样本的任务标签对应的目标分类器，基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型；

基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果。
根据权利要求9所述的计算机设备，其中，所述初始第一多任务学习模型包括网络交互层、多个网络主体及与每个网络主体对应的第一分类器，所述基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型包括：

利用所述训练样本自底向上对所述网络交互层及所述目标网络主体进行训练得到第一网络交互层参数及第一网络主体参数；

利用反向传播算法更新所述第一网络交互层参数得到第二网络交互参数，及更新所述第一网络主体参数得到第二网络主体参数；

基于所述第二网络交互参数及所述第二网络主体参数得到对应所述任务标签的目标第一多任务学习模型。
根据权利要求9所述的计算机设备，其中，所述初始第二多任务学习模型包括第二分类器，所述基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型包括：

利用所述训练样本自底向上对所述第二分类器进行训练得到第第二分类器参数；

利用反向传播算法更新所述第二分类器参数得到第三分类器参数；

基于所述第三分类器参数得到对应所述任务标签的目标第二多任务学习模型。
根据权利要求10所述的计算机设备，其中，所述利用所述训练样本自底向上对所述网络交互层及所述目标网络主体进行训练得到第一网络交互层参数及第一网络主体参数包括：

调用对应所述目标网络主体的第一嵌入层对所述训练样本进行向量表征处理，得到每个训练样本的语义表征向量；

调用所述网络交互层计算所述语义表征向量的注意力权值；

根据所述注意力权值调用第一预设编码器对所述语义表征向量进行语义识别处理，得到语义特征向量，所述第一预设编码器包括2层transformer编码器或2层BiLstm编码器；

调用所述目标第一分类器对所述语义特征向量进行训练得到第一网络交互层参数及第一网络主体参数。
根据权利要求9所述的计算机设备，其中，在所述得到目标第一多任务学习模型或者所述目标第二多任务学习模型之前，还实现以下步骤：

获取测试样本；

将所述测试样本输入至更新完参数的第一多任务学习模型或者第二多任务学习模型，得到分类测试结果；

根据所述分类测试结果计算损失值；

检测所述损失值是否处于预设损失范围；

当检测结果为所述损失值处于预设损失范围时，将训练得到的模型作为目标第一多任务学习模型或者目标第二多任务学习模型。
根据权利要求9所述的计算机设备，其中，所述检测所述训练样本是否为单一任务训练样本包括：

获取所述训练样本的任务标签；

检测所述任务标签是否一致；

当检测结果为所述任务标签不一致时，确定所述训练样本为多任务训练样本；

当检测结果为所述任务标签一致时，确定所述训练样本为单一任务训练样本。
根据权利要求9所述的计算机设备，其中，所述基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果包括：

检测所述待分类任务是否为单一分类任务；

当检测结果为所述待分类任务为单一分类任务时，调用所述目标第一多任务学习模型对所述待分类任务进行分类并输出分类结果；

当检测结果为所述待分类任务为多分类任务时，调用所述目标第二多任务学习模型对所述待分类任务进行分类并输出分类结果。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

获取训练样本及所述训练样本的任务标签；

检测所述训练样本是否为单一任务训练样本；

当检测结果为所述训练样本为单一任务训练样本时，确定初始第一多任务学习模型中与所述任务标签对应的目标网络主体，基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型；

当检测结果为所述训练样本为多任务训练样本时，确定初始第二多任务学习模型中与每个任务训练样本的任务标签对应的目标分类器，基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型；

基于所述目标第一多任务学习模型或者所述目标第二多任务学习模型对待分类任务进行分类并输出分类结果。
根据权利要求16所述的计算机可读存储介质，其中，所述初始第一多任务学习模型包括网络交互层、多个网络主体及与每个网络主体对应的第一分类器，所述基于所述目标网络主体对所述训练样本进行训练，得到目标第一多任务学习模型包括：

利用所述训练样本自底向上对所述网络交互层及所述目标网络主体进行训练得到第一网络交互层参数及第一网络主体参数；

利用反向传播算法更新所述第一网络交互层参数得到第二网络交互参数，及更新所述第一网络主体参数得到第二网络主体参数；

基于所述第二网络交互参数及所述第二网络主体参数得到对应所述任务标签的目标第一多任务学习模型。
根据权利要求16所述的计算机可读存储介质，其中，所述初始第二多任务学习模型包括第二分类器，所述基于所述目标分类器对对应的训练样本进行训练，得到目标第二多任务学习模型包括：

利用所述训练样本自底向上对所述第二分类器进行训练得到第第二分类器参数；

利用反向传播算法更新所述第二分类器参数得到第三分类器参数；

基于所述第三分类器参数得到对应所述任务标签的目标第二多任务学习模型。
根据权利要求17所述的计算机可读存储介质，其中，所述利用所述训练样本自底向上对所述网络交互层及所述目标网络主体进行训练得到第一网络交互层参数及第一网络主体参数包括：

调用对应所述目标网络主体的第一嵌入层对所述训练样本进行向量表征处理，得到每个训练样本的语义表征向量；

调用所述网络交互层计算所述语义表征向量的注意力权值；

根据所述注意力权值调用第一预设编码器对所述语义表征向量进行语义识别处理，得到语义特征向量，所述第一预设编码器包括2层transformer编码器或2层BiLstm编码器；

调用所述目标第一分类器对所述语义特征向量进行训练得到第一网络交互层参数及第一网络主体参数。
根据权利要求16所述的计算机可读存储介质，其中，在所述得到目标第一多任务学习模型或者所述目标第二多任务学习模型之前，还实现以下步骤：

获取测试样本；

将所述测试样本输入至更新完参数的第一多任务学习模型或者第二多任务学习模型，得到分类测试结果；

根据所述分类测试结果计算损失值；

检测所述损失值是否处于预设损失范围；

当检测结果为所述损失值处于预设损失范围时，将训练得到的模型作为目标第一多任务学习模型或者目标第二多任务学习模型。