WO2021254114A1

WO2021254114A1 - 构建多任务学习模型的方法、装置、电子设备及存储介质

Info

Publication number: WO2021254114A1
Application number: PCT/CN2021/095977
Authority: WO
Inventors: 陈潇凯; 顾晓光; 付立波
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2020-06-17
Filing date: 2021-05-26
Publication date: 2021-12-23
Also published as: CN111723910A; US20220383200A1

Abstract

本申请提供了一种构建多任务学习模型的方法、装置、电子设备及计算机可读存储介质；方法包括：在输入节点与多个任务节点之间，通过将子网络层与搜索层交错排布的方式，构建由多个子网络层以及多个搜索层构成的搜索空间；对从输入节点、经由搜索空间而到达每个任务节点的路径进行采样，得到候选路径，并作为候选网络结构；根据样本数据，对候选网络结构的参数进行训练，生成用于进行多个任务预测的多任务学习模型。

Description

构建多任务学习模型的方法、装置、电子设备及存储介质

相关申请的交叉引用

本申请实施例基于申请号为202010555648.0、申请日为2020年06月17日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请实施例作为参考。

技术领域

本申请涉及人工智能技术，尤其涉及一种构建多任务学习模型的方法、装置、电子设备及计算机可读存储介质。

背景技术

人工智能(Artificial Intelligence，AI)是计算机科学的一个综合技术，通过研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科，涉及领域广泛，例如自然语言处理技术以及机器学习/深度学习等几大方向，随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

相关技术中缺乏基于人工智能来确定多任务学习模型的有效方案，主要依赖于人工对各种模型进行验证，以选择出最合适的网络结构作为多任务学习模型。但是，这种方式效率太低，浪费大量的人力以及物力。

发明内容

本申请实施例提供一种构建多任务学习模型的方法、装置、电子设备及存储介质，能够自动并准确地构建多任务学习模型，提高多任务学习模型构建的效率。

本申请实施例的技术方案是这样实现的：

本申请实施例提供一种构建多任务学习模型的方法，包括：

在输入节点与多个任务节点之间，通过将子网络层与搜索层交错排布的方式，构建由多个所述子网络层以及多个所述搜索层构成的搜索空间；

对从所述输入节点、经由所述搜索空间而到达每个所述任务节点的路径进行采样，得到候选路径，并作为候选网络结构；

根据样本数据，对所述候选网络结构的参数进行训练，生成用于进行多个任务预测的多任务学习模型。

本申请实施例提供一种构建多任务学习模型的装置，包括：

构建模块，用于在输入节点与多个任务节点之间，通过将子网络层与搜索层交错排布的方式，构建由多个所述子网络层以及多个所述搜索层构成的搜索空间；

采样模块，用于对从所述输入节点、经由所述搜索空间而到达每个所述任务节点的路径进行采样，得到候选路径，并作为候选网络结构；

生成模块，用于根据样本数据，对所述候选网络结构的参数进行训练，生成用于进行多个任务预测的多任务学习模型。

本申请实施例提供一种用于构建多任务学习模型的电子设备，所述电子设备包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的构建多任务学习模型的方法。

本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本申请实施例提供的构建多任务学习模型的方法。

本申请实施例具有以下有益效果：

通过在输入节点与多个任务节点之间，将子网络层与搜索层交错排布的方式，构建多层结构的搜索空间，并根据样本数据，从搜索空间中搜索出用于进行多个任务预测的多任务学习模型，从而实现自动并准确地构建多任务学习模型，提高多任务学习模型构建的效率；进而，根据由多个子网络层以及多个搜索层构成的搜索空间，确定出多层结构的多任务学习模型，使得多任务学习模型能够进行层级的多任务学习，提高学习能力。

附图说明

图1是相关技术提供的多门控多专家模型的结构示意图；

图2是本申请实施例提供的多任务学习模型构建系统的应用场景示意图；

图3是本申请实施例提供的用于构建多任务学习模型的电子设备的结构示意图；

图4-7是本申请实施例提供的构建多任务学习模型的方法的流程示意图；

图8是本申请实施例提供的搜索块的示意图；

图9是本申请实施例提供的搜索空间的示意图；

图10是本申请实施例提供的搜索过程的流程示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，所涉及的术语“第一\第二”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释。

1)深度学习(Deep Learning，DL)：机器学习(Machine Learning，ML)领域中一个新的研究方向。学习样本数据的内在规律和表示层次，以获得对文字、图像和声音等数据的解释。最终让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据，模仿视听和思考等人类的活动。

2)多任务学习模型：用于进行多个任务的分类或预测，例如，对于新闻推荐，通过多任务学习模型预估新闻的点击率以及完成度，从而根据各新闻的点击率以及完成度进行个性化的新闻推荐。

多任务学习模型包括输入节点、子网络层、搜索层以及任务节点，其中，输入节点分别对应多任务学习模型的入口，输入节点接收的数据，用于作为多个(即至少2个)任务节点进行分类或预测任务的基础；子网络层包括多个子网络模块(即为多门控多专家模型中的专家，是一种独立的神经网络模块，可以由单个全连接层与激活函数组成)；搜索层包括多个搜索块，每一个搜索块代表一个子搜索空间，包含若干个局部网络结构(例如，子网络模块之间的连接)；任务节点对应多任务学习模型的出口，任务节点的数量与具体应用场景中需要实施的分类或预测的任务的数量相关。

3)网络参数：指网络结构中各模块(例如子网络模块、搜索块、任务节点等)进行计算时的参数。

4)结构参数：用于表征搜索空间中搜索块中局部结构被采样的可能性，例如，第i个搜索块包括N个局部结构，则结构参数α _i为N维向量，其中结构参数α _i中的值越大，则该值对应的局部结构被采样的可能性越大。

相关技术中，通过多门控多专家方法进行多任务学习。相比于底层共享，该多门控多专家方法使得每个任务都可以动态聚合共享专家的输出，能更好的处理多个任务直接的关系。多门控多专家方法将底部共享层拆解为多个专家(独立的神经网络模块，可以由单个全连接层与激活函数组成)，然后通过门控动态聚合专家的输出，并将动态聚合的结果输出至相应的任务节点。该多门控多专家方法并未限制专家的个数，但是门控与任务是一一对应的，因此，门控个数等于任务个数。如图1所示，多门控多专家模型包括2个任务节点、2个门控和3个专家，设输入为x，则3个专家的输入为d维向量x、输出为

其中e表示函数变换，即可以视为全连接层、卷积层，对于任务A，门控A用于计算三个专家对于任务A的权重(标量)

门控可以为一个全连接层，输入为向量x、输出为三个专家的得分

其中，权重是由得分经过归一化指数函数变换后得到的，即

并根据门控A计算得到的权重，即可获得任务A的输入为

其中，任务B的处理过程与任务A的处理过程类似，门控B的作用与门控A类似。

虽然，多门控多专家方法可以进行多任务学习，但存在几个问题，分别为1)多门控多专家模型(Multi-gate Mixture-of-Experts，MMOE)中的所有专家被所有任务共享，但是这不一定是最优的方式；2)多门控多专家模型中专家的组合是线性的(加权和)，表征能力受限；3)当专家层增多时，门控的输入选择难以确定。

为了解决上述问题，本申请实施例提供了一种构建多任务学习模型的方法、装置、电子设备及计算机可读存储介质，能够自动并准确地构建多任务学习模型，提高多任务学习模型构建的效率。

下面说明本申请实施例提供的用于构建多任务学习模型的电子设备的示例性应用。

本申请实施例提供的用于构建多任务学习模型的电子设备可以是各种类型的终端设备或服务器，其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器；终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

以服务器为例，例如可以是部署在云端的服务器集群，向开发人员开放人工智能云服务(AI as a Service，AIaaS)，AIaaS平台会把几类常见的AI服务进行拆分，并在云端提供独立或者打包的服务，这种服务模式类似于一个AI主题商城，所有的开发人员都可以通过应用程序编程接口的方式来接入使用AIaaS平台提供的一种或者多种人工智能服务。例如，其中的一种人工智能云服务为多任务学习模型构建服务，即云端的服务器封装有多任务学习模型构建的程序。开发人员通过终端调用云服务中的多任务学习模型构建服务，以使部署在云端的服务器调用封装的多任务学习模型构建的程序，从构建的搜索空间中确定出多任务学习模型，后续根据多任务学习模型进行推荐应用，例如，对于新闻推荐应用，通过多任务学习模型预估新闻的点击率以及完成度，从而根据各新闻的点击率以及完成度进行个性化的新闻推荐。

参见图2，图2是本申请实施例提供的多任务学习模型构建系统10的应用场景示意图，终端200通过网络300连接服务器100，网络300可以是广域网或者局域网，又或者是二者的组合。

终端200(运行有客户端，例如新闻客户端、视频客户端等)可以被用来获取样本数据，例如，开发人员通过终端输入推荐样本数据集，输入完成后，终端自动获取推荐样本数据集。

在一些实施例中，终端200中运行的客户端中可以植入有构建多任务学习模型插件，以在本地执行本申请实施例提供的构建多任务学习模型的方法，来从构建的搜索空间中确定出多任务学习模型，例如，在终端200上安装有推荐客户端，例如视频客户端、新闻客户端等，开发人员在推荐客户端中输入推荐样本数据集后，终端200调用构建多任务学习模型插件，以构建由多个子网络层以及多个搜索层构成的搜索空间，并根据样本数据，从搜索空间中搜索到用于进行多个任务预测的多任务学习模型，后续根据多任务学习模型进行推荐应用，例如，对于视频应用，通过多任务学习模型预估视频的点击率以及完成度，从而根据各视频的点击率以及完成度确定推荐的视频，并通过视频客户端进行个性化的视频推荐；对于新闻应用，通过多任务学习模型预估新闻的曝光率以及点击率，从而根据各新闻的曝光率以及点击率确定推荐的新闻，并通过新闻客户端进行个性化的新闻推荐。

在一些实施例中，终端200也可以通过网络300向云端的服务器100发送开发人员在终端200上输入的推荐样本数据集，并调用服务器100的多任务学习模型构建接口(可以提供为云服务的形式，多任务学习模型构建服务，即封装有任务学习模型构建的程序)，服务器100接收到推荐样本数据集后，通过本申请实施例提供的构建多任务学习模型的方法，从构建的搜索空间中确定出多任务学习模型，例如，在终端200上安装推荐客户端(例如购物客户端)，开发人员在推荐客户端中，输入推荐样本数据集，终端200通过网络300调用服务器100的多任务学习模型构建接口，即调用封装的多任务学习模型构建的程序，构建由多个子网络层以及多个搜索层构成的搜索空间，并根据样本数据，从搜索空间中搜索到用于进行多个任务预测的多任务学习模型，后续根据多任务学习模型进行推荐应用，例如，对于购物应用，服务器通过多任务学习模型预估商品的点击率以及购买率，从而根据商品的点击率以及购买率确定推荐的商品，并将推荐的商品返回至购物客户端，并通过购物客户端进行个性化的商品推荐。

下面说明本申请实施例提供的用于构建多任务学习模型的电子设备的结构，用于构建多任务学习模型的电子设备可以是各种终端，例如手机、电脑等，也可以是如图2示出的服务器100。

参见图3，图3是本申请实施例提供的用于构建多任务学习模型的电子设备500的结构示意图，以电子设备500是服务器为例说明，图3所示的用于构建多任务学习模型的电子设备500包括：至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。电子设备500中的各个组件通过总线系统540耦合在一起。可理解，总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图3中将各种总线都标为总线系统540。

处理器510可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

存储器550包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。其中，非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memory)。本申请实施例描述的存储器550旨在包括任意适合类型的存储器。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。

在一些实施例中，存储器550能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统551，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块552，用于经由一个或多个(有线或无线)网络接口520到达其他计算设备，示例性的网络接口520包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，Universal Serial Bus)等；

在一些实施例中，本申请实施例提供的构建多任务学习模型的装置可以采用软件方式实现，例如，可以是上文所述的终端中的构建多任务学习模型插件，可以是上文所述的服务器中多任务学习模型构建服务。

当然，不局限于此，本申请实施例提供的构建多任务学习模型的提取装置可以提供为各种软件实施例，包括应用程序、软件、软件模块、脚本或计算机代码在内的各种形式。

总而言之，本申请实施例提供的构建多任务学习模型的方法，可以实施为任意形式的计算机程序产品，并根据需要部署到各种电子设备中。

图3示出了存储在存储器550中的构建多任务学习模型的提取装置555，其可以是程序和插件等形式的软件，并包括一系列的模块，包括构建模块5551、采样模块5552以及生成模块5553；其中，构建模块5551、采样模块5552以及生成模块5553用于实现本申请实施例提供的多任务学习模型构建的功能。

根据上文可以理解，本申请实施例提供的构建多任务学习模型的方法可以由各种类型的用于构建多任务学习模型的电子设备实施，例如智能终端和服务器等。

下面结合本申请实施例提供的服务器的示例性应用和实施，说明本申请实施例提供的构建多任务学习模型的方法。参见图4，图4是本申请实施例提供的构建多任务学习模型的方法的流程示意图，结合图4示出的步骤进行说明。

在下面的步骤中，涉及的输入节点和任务节点，分别对应多任务学习模型的入口和出口，输入节点接收的数据，用于作为多个(即至少2个)任务节点进行分类或预测任务的基础，任务节点的数量与具体应用场景中需要实施的分类或预测的任务的数量相关。

在步骤101中，在输入节点与多个任务节点之间，通过将子网络层与搜索层交错排布的方式，构建由多个子网络层以及多个搜索层构成的搜索空间。

作为获取样本数据的示例，开发人员可以在终端输入样本数据集，输入完成后，终端自动将样本数据集发送至服务器，服务器接收样本数据集。对于推荐的应用场景，该样本数据为推荐样本数据，例如，对于新闻推荐应用，样本数据为新闻样本数据；对于商品推荐应用，样本数据为商品样本数据；对于电影推荐应用，样本数据为电影样本数据。

在服务器接收到样本数据集后，调用构建多任务学习模型的程序，在输入节点与多个任务节点之间，构建由多个子网络层以及多个搜索层构成的搜索空间，其中，子网络层与搜索层是交错排布的，每个子网络层包括多个子网络模块，每个搜索层包括多个搜索块，例如，输入节点与第1个子网络层连接，第1个子网络层与第1个搜索层连接，第1个搜索层与第2个子网络层连接，以此类推，直至最后一个搜索层与任务节点连接，即实现在输入节点与多个任务节点之间，构建由多个子网络层以及多个搜索层构成的搜索空间，在确定搜索空间后，从搜索空间中获得多任务学习模型，以通过多任务学习模型进行多任务预测。

其中，对于推荐的应用场景，在输入节点与多个用于推荐预测的任务节点之间，通过将子网络层与搜索层交错排布的方式，构建由多个子网络层以及多个搜索层构成的搜索空间。其中，输入节点的输入为推荐数据，例如商品数据、新闻数据等，任务节点的输出为针对推荐数据的预测结果，例如点击率、完成度(例如，视频观看的完成程度、新闻浏览的时间)等。

其中，当搜索层的后驱节点为子网络层中的子网络模块时，搜索层中的搜索块的输出为子网络模块的输入；当搜索层的后驱节点为任务节点时，搜索层中的搜索块的输出为任务节点的输入。

参见图5，图5是本申请实施例提供的构建多任务学习模型的方法的一个可选的流程示意图，图5示出图4还包括步骤104-步骤105：在步骤104中，对子网络层中的多个子网络模块的输出进行抽样处理，得到多个抽样后的子网络模块的输出；在步骤105中，根据多个子网络模块中各子网络模块的权重，对多个抽样后的子网络模块的输出进行加权求和，将加权求和的结果作为搜索块中的局部结构的输出，以构建搜索块的传输路径，其中，搜索块为与子网络层相邻的搜索层中的模块。

作为示例，在构建搜索空间之前，构建每个搜索层中搜索块的结构。对子网络层中的多个子网络模块的输出进行抽样处理，以获得多个抽样后的子网络模块的输出，如图8所示，某子网络层中有3个子网络模块，对该3个子网络模块的输出(v1、v2、v3)进行抽样，可以得到7种抽样结果，即(v1)、(v2)、(v3)、(v1和v2)、(v1和v3)、(v2和v3)、(v1、v2和v3)，当采样获得的是一个子网络模块的输出时，例如(v1)、(v2)、(v3)，将该子网络模块的输出作为搜索块中的局部结构的输出，以构建该搜索块中的传输路径，该搜索块为与子网络层相邻的搜索层中的模块；当采样获得的是多个子网络模块的输出时，例如(v1和v2)、(v1和v3)、(v2和v3)、(v1、v2和v3)，则根据多个子网络模块中各子网络模块的权重，对多个子网络模块的输出进行加权求和，将加权求和的结果作为搜索块中的局部结构的输出，以构建搜索块的传输路径，该搜索块为与子网络层相邻的搜索层中的模块。因此，通过构建搜索块中的多条传输路径，使得后续构建的搜索空间能够包含足够多可能的网络结构，从而可以解决特定的多任务学习问题。

在一些实施例中，搜索块还包括门控节点；对子网络层中的多个子网络模块的输出进行抽样处理之后，还包括：从子网络层的信号源集合中采样一个信号源，信号源为输入节点的输出或子网络层的前驱子网络模块的输出；通过门控节点对信号源进行预测处理，得到多个子网络模块中各子网络模块的预测值；对各子网络模块的预测值进行归一化处理，得到各子网络模块的权重。

承接上述示例，为了构建搜索块中的多条传输路径，对于某子网络层，服务器可以从该子网络层的信号源集合中采样一个信号源，并通过门控节点对该信号源进行预测，以得到该子网络层中多个子网络模块中每个子网络模块的预测值，即

e＝[e ₁,e ₂,...,e _s]，其中，e表示该子网络层中多个子网络模块的预测值，

表示信号源，w ^k表示门控的可学习参数。在服务器得到每个子网络模块的预测值后，可以归一化子网络模块的预测值，以得到每个子网络模块的权重，即

其中，s表示子网络模块的数量。因此，通过不同的信号源，以确定出不同的权重，从而构建搜索块中的多条传输路径，使得后续构建的搜索空间能够包含足够多可能的网络结构，从而可以解决特定的多任务学习问题。

在一些实施例中，搜索空间包括N个子网络层以及N个搜索层，其中，N为大于1的自然数；构建由多层的子网络层以及多层的搜索层构成的搜索空间之前，包括：通过第1个搜索层中的第i个搜索块，从第1个子网络层中采样出多个子网络模块的输出，其中，i为正整数，并当信号源为输入节点的输出时，根据多个子网络模块中各子网络模块的权重，对多个子网络模块的输出进行加权求和，将加权求和的结果作为第i个搜索块中的局部结构的输出，以构建第i个搜索块中的传输路径，直至完成第i个搜索块中所有局部结构的传输路径的构建；通过第j个搜索层中的第i个搜索块，从第j个子网络层中采样出多个子网络模块的输出，其中，1<j≤N，j为自然数，并当信号源为输入节点或者第j个子网络层的前驱子网络模块的输出时，根据多个子网络模块中各子网络模块的权重，对多个子网络模块的输出进行加权求和，将加权求和的结果作为第j个搜索层中的第i个搜索块中的局部结构的输出，以构建第j个搜索层中的第i个搜索块中的传输路径，直至完成第j个搜索层中的第i个搜索块中所有局部结构的传输路径的构建。

作为示例，通过第1个搜索层中的第i个搜索块，从第1个子网络层中采样出一个子网络模块或者多个子网络模块的输出，该第1个搜索层的信号源为输入节点的输出，则通过门控节点对信号源进行预测处理，得到多个子网络模块中各子网络模块的预测值，对各子网络模块的预测值进行归一化处理，得到各子网络模块的权重，并根据多个子网络模块中各子网络模块的权重，对多个子网络模块的输出进行加权求和，将加权求和的结果作为第i个搜索块中的局部结构的输出，以构建第i个搜索块中的传输路径，直至完成第i个搜索块中所有局部结构的传输路径的构建。

通过第j个搜索层中的第i个搜索块，从第j个子网络层中采样出多个子网络模块的输出，该第1个搜索层的信号源为输入节点的输出或者第j个子网络层的前驱子网络模块的输出，则通过门控对信号源进行预测处理，得到多个子网络模块中各子网络模块的预测值，对各子网络模块的预测值进行归一化处理，得到各子网络模块的权重，并根据多个子网络模块中各子网络模块的权重，对多个子网络模块的输出进行加权求和，将加权求和的结果作为第j个搜索层中的第i个搜索块中的局部结构的输出，以构建第j个搜索层中的第i个搜索块中的传输路径，直至完成第j个搜索层中的第i个搜索块中所有局部结构的传输路径的构建，从而完成所有搜索块中局部结构的构建。

在一些实施例中，构建由多个子网络层以及多个搜索层构成的搜索空间，包括：将输入节点到第一个子网络层的传输路径、中间的子网络层到相邻的搜索层的传输路径以及最后一个搜索层到任务节点的传输路径，作为有向图的边；将多个子网络层中的子网络模块以及多个搜索层中的搜索块，作为有向图的节点；对有向图的节点以及边进行组合，以构建用于多任务学习的搜索空间。

作为示例，可以以有向图的方式构建搜索空间。将输入节点到第一子网络层的传输路径作为有向图的边，还可以将中间的子网络层(第一子网络层至最后一个子网络层)到相邻的搜索层的传输路径作为有向图的边，例如，第二子网络层到相邻的第二搜索层的传输路径，并将多个子网络层中的子网络模块以及多个搜索层中的搜索块，作为有向图的节点，则根据有向图的节点以及边，构建用于多任务学习的搜索空间。后续可以对有向图的边进行采样，以实现对搜索空间的采样，以获得候选网络结构。

在步骤102中，对从输入节点、经由搜索空间而到达每个任务节点的路径进行采样，以得到候选路径，并作为候选网络结构。

在服务器构建搜索空间后，可以采样从输入节点、经由搜索空间而到达每个任务节点的路径，以确定候选网络结构。由于搜索空间包含足够多可能的网络结构，因此，从输入节点、经由搜索空间而到达每个任务节点的路径进行采样，所得到的候选网络结构包含各种各样的结构，从而可以解决特定的多任务学习问题。

参见图6，图6是本申请实施例提供的构建多任务学习模型的方法的一个可选的流程示意图，图6示出图4的步骤102可通过图6中的步骤1021-步骤1022实现：在步骤1021中，根据搜索空间的结构参数，对搜索空间中搜索层的每个搜索块进行采样，得到对应每个搜索块的局部结构；在步骤1022中，将从输入节点、经由每个搜索块的局部结构而到达每个任务节点的路径作为候选路径。

作为示例，由于搜索空间中的每个搜索块都包含多个局部结构，因此，可以先根据搜索空间的结构参数，采样搜索空间中的每个搜索块，采样得到每个搜索块的局部结构(传输路径)，并将从输入节点、经由每个搜索块的局部结构而到达每个任务节点的路径作为候选路径，从而形成候选网络结构。

在一些实施例中，根据搜索空间的结构参数，对搜索空间中搜索层中的每个搜索块进行采样，得到对应每个搜索块的局部结构，包括：对搜索空间的结构参数进行映射处理，得到对应搜索空间中每个搜索块中的局部结构的采样概率；根据每个搜索块中的局部结构的采样概率，构建每个搜索块的多项式分布；对每个搜索块的多项式分布进行采样处理，得到对应每个搜索块的局部结构。

承接上述示例，为了采样得到每个搜索块的局部结构，可以先对搜索空间的结构参数进行映射，得到每个搜索块中的各局部结构的采样概率，并根据每个搜索块中的各局部结构的采样概率，构建每个搜索块的多项式分布，最后根据每个搜索块的多项式分布，对每个搜索块中的局部结构进行采样，得到对应每个搜索块的局部结构，例如当搜索空间包括B个搜索块，对每个搜索块中的多个局部结构进行采样，得到对应的一个局部结构，则可以得到B个局部结构，组合该B个局部结构、输入节点、子网络模块以及任务节点，即可得到完整的某一候选网络结构。

在步骤103中，根据样本数据，对候选网络结构的参数进行训练，以生成用于进行多个任务预测的多任务学习模型。

在服务器根据搜索空间，采样得到候选网络结构后，对候选网络结构的参数进行训练，迭代采样以及训练操作，可以生成用于进行多个任务预测的多任务学习模型。对于推荐的应用场景，可以根据推荐样本数据，对候选网络结构的参数进行训练，以生成用于进行多个推荐预测的多任务学习模型。例如，任务节点的输出为新闻的点击率、完成度，则根据新闻样本数据，对候选网络结构的参数进行训练，以生成用于进行多个任务预测的多任务学习模型，该多任务学习模型用于预测新闻的点击率、完成度，后续根据新闻的点击率、完成度进行新闻推荐。

参见图7，图7是本申请实施例提供的构建多任务学习模型的方法的一个可选的流程示意图，图7示出图4的步骤103可通过图7中的步骤1031-步骤1033实现：在步骤1031中，对候选网络结构的网络参数进行训练，得到优化后的候选网络结构的网络参数；在步骤1032中，根据优化后的候选网络结构的网络参数，对搜索空间的结构参数进行训练，得到优化后的搜索空间的结构参数；在步骤1033中，根据优化后的搜索空间的结构参数，从各优化后的候选网络结构中确定出用于进行多个任务预测的候选网络结构，以作为多任务学习模型。

作为示例，在服务器采样得到候选网络结构后，可以先对候选网络结构的网络参数进行训练，再对结构参数进行训练，也可以先对结构参数进行训练，再对网络参数进行训练。例如，可以对候选网络结构的网络参数进行训练，得到优化后的候选网络结构的网络参数后，再根据优化后的候选网络结构(由于候选网络结构是通过网络参数构成的，因此候选网络结构的网络参数优化后，即优化了候选网络结构)，对搜索空间的结构参数进行训练，得到优化后的搜索空间的结构参数，最后根据优化后的搜索空间的结构参数，从各优化后的候选网络结构中确定出用于进行多个任务预测的候选网络结构，以作为多任务学习模型。其中，网络参数是指网络结构中各模块(例如子网络模块、搜索块、任务节点等)进行计算时的参数，结构参数用于表征搜索空间中搜索块中局部结构被采样的可能性，例如第i个搜索块包括N个局部结构，则结构参数α _i为N维向量，其中结构参数α _i中的值越大，则该值对应的局部结构被采样的可能性越大。

在一些实施例中，对候选网络结构的网络参数进行训练，得到优化后的候选网络结构的网络参数，包括：通过候选网络结构对样本数据进行多任务预测处理，得到样本数据的多任务的预测结果；根据多任务的预测结果以及样本数据的多任务标签，构建候选网络结构的损失函数；更新候选网络结构的网络参数直至损失函数收敛，将损失函数收敛时候选网络结构的更新的参数，作为优化后的候选网络结构的网络参数。

其中，根据多任务的预测结果以及样本数据的多任务标签，确定候选网络结构的损失函数的值后，可以判断损失函数的值是否超出预设阈值，当损失函数的值超出预设阈值时，基于损失函数确定候选网络结构的误差信号，将误差信息在候选网络结构中反向传播，并在传播的过程中更新各个层的模型参数。

这里，对反向传播进行说明，将训练样本数据输入到神经网络模型的输入层，经过隐藏层，最后达到输出层并输出结果，这是神经网络模型的前向传播过程，由于神经网络模型的输出结果与实际结果有误差，则计算输出结果与实际值之间的误差，并将该误差从输出层向隐藏层反向传播，直至传播到输入层，在反向传播的过程中，根据误差调整模型参数的值；不断迭代上述过程，直至收敛。其中，候选网络结构属于神经网络模型。

在一些实施例中，根据优化后的候选网络结构的网路参数，对搜索空间的结构参数进行训练，得到优化后的搜索空间的结构参数，包括：通过样本数据以及优化后的候选网络结构的网络参数进行网路结构的评估处理，得到优化后的候选网络结构的评估结果；根据评估结果，构建搜索空间的结构参数的目标函数；更新搜索空间的结构参数直至目标函数收敛，将目标函数收敛时搜索空间的更新的结构参数，作为优化后的搜索空间的结构参数。

作为示例，在服务器得到优化后的候选网络结构后，通过优化后的候选网络结构对样本数据进行预测，得到多任务的预测结果，并根据多任务的预测结果，对优化后的候选网络结构进行评估，得到优化后的候选网络结构的评估结果，例如准确率、ROC曲线下方的面积大小(Area Under Curve，AUC)、损失等，并根据评估结果，构建搜索空间的结构参数的目标函数，即

其中p(α)表示由结构参数α确定的多项式分布，R _val表示优化后的候选网络结构的评估结果，更新搜索空间的结构参数直至目标函数收敛，将目标函数收敛时搜索空间的更新的结构参数，作为优化后的搜索空间的结构参数。

在一些实施例中，根据优化后的搜索空间的结构参数，从各优化后的候选网络结构中确定出用于进行多个任务预测的候选网络结构，以作为多任务学习模型，包括：对优化后的搜索空间的结构参数进行映射处理，得到对应搜索空间中每个搜索块中的局部结构的采样概率；将每个搜索块中的局部结构的最大采样概率对应的局部结构，作为用于进行多个任务预测的候选网络结构的局部结构；将每个候选网络结构的局部结构进行组合，得到多任务学习模型。

作为示例，在服务器得到优化后的搜索空间的结构参数后，可以根据优化后的搜索空间的结构参数，从搜索空间中搜索出最优的网络结构。对优化后的搜索空间的结构参数进行映射，例如逻辑回归函数(softmax函数)，得到对应搜索空间中每个搜索块中的局部结构的采样概率，并将每个搜索块中的局部结构的最大采样概率对应的局部结构，作为用于进行多个任务预测的候选网络结构的局部结构，最后组合每个候选网络结构的局部结构，以得到多任务学习模型。

下面，将说明本申请实施例在一个实际的应用场景中的示例性应用。

本申请实施例可以应用于各种推荐的应用场景中，如图2所示，终端200通过网络300连接部署在云端的服务器100，在终端200上安装多任务学习模型构建应用，开发人员在多任务学习模型构建应用中，输入推荐样本数据集，终端200通过网络300向服务器100发送该推荐样本数据集，服务器100接收到推荐样本数据集后，从构建的搜索空间中确定出最优的网络结构，以作为多任务学习模型，后续根据多任务学习模型进行推荐应用，例如，对于新闻推荐应用，通过多任务学习模型预估新闻的点击率以及完成度，从而根据新闻的点击率以及完成度进行个性化的新闻推荐；对于商品推荐应用，通过多任务学习模型预估商品的点击率(CTR)以及转化率(CVR)，从而根据商品的点击率以及转化率进行个性化的商品推荐；对于电影推荐应用，通过多任务学习模型预估电影的购买率以及用户的评分，从而根据电影的购买率以及用户的评分进行个性化的电影推荐。

虽然，相关技术中的多门控多专家方法可以进行多任务学习，但存在几个问题，分别为1)多门控多专家模型(Multi-gate Mixture-of-Experts，MMOE)中的所有专家被所有任务共享，但是这不一定是最优的方式；2)多门控多专家模型中专家的组合是线性的(加权和)，表征能力受限；3)当专家层增多时，门控的输入选择难以确定。

为了解决上述问题，本申请实施例从神经网络架构搜索的角度出发，使用搜索算法在搜索空间中寻找最优的网络结构，以极大地缓解人工调整网络结构的成本。首先，设计了一个搜索空间，该空间枚举了子网络模块(专家)之间、子网络模块与任务之间的对应关系。由于该搜索空间可以是多层的，并且门控的输入来源也纳入到搜索空间中，即搜索空间中包括上述多门控多专家模型。本申请实施例使用多项式分布采样与策略梯度算法以可微分的方式高效地在搜索空间中寻找最优网络结构，以作为多任务学习模型，从而能够达到比多门控多专家方法更好的效果。

下面，说明本申请实施例提供的构建多任务学习模型的方法，该方法包括两个部分，分别为：1)搜索空间的构建；2)搜索算法。

1)搜索空间的构建

构建搜索空间的目标是使得搜索空间包含足够多可能的网络结构，从而可以解决特定的多任务学习问题。首先把参数共享的部分划分为若干个子网络。假设对于一个有T个任务的机器学习问题，子网络层(专家)有L层，每层有H个子网络模块。

从整体上说，搜索空间由若干个搜索块(Search Block)组成。每一个搜索块代表一个子搜索空间，包含若干个局部网络结构(例如，子网络模块之间的连接)。下面，介绍一个搜索块的具体结构：

如图8所示，一个搜索块表示一个子搜索空间，其中包含多种不同的局部网络结构(局部结构)。对于某个局部结构来说，使用门控实现输入特征的动态聚合。其中，局部结构受两个因素的影响，分别为：1)不同的输入(组合)；2)不同的门控信号来源(信号源)。

其中，一个搜索块表示的子搜索空间可以形式化表示为

其中

和

均表示集合，×表示笛卡尔积，

表示所有输入特征的组合(其中，输入来自上一层子网络模块的输出)，集合

表示为

表示所有可能的门控信号来源，例如所有前子网络层的输入以及原始共享输入均可作为信号来源，

表示子搜索空间。即一个搜索块中一共可有

个不同的局部结构。对于搜索块中任一一个局部结构(第k个局部结构，

)，第k个局部结构的输入为

(s个输入特征，每个特征为d _v维)和

(门控信号源，维度为d _q)，第k个局部结构的输出为y _k，即输入特征的加权和，计算公式如公式(1)所示：

其中，

e＝[e ₁,e ₂,...,e _s]，g ^k表示该局部网络的门控，m _i表示第i个输入特征的门控得分(预测值)，w ^k表示门控的可学习参数。

如图9所示，搜索空间中的搜索块位于相邻两层子网络层之间，或者位于最后一层子网络层到任务层(包含多个任务节点)之间。因此，搜索块的总数为B＝(L-1)*H+T，其中，T表示任务节点的数量。本申请实施例的搜索空间

可以表示为B个搜索块所表示的空间的笛卡尔积

即物理构成可以视作一个超网络(Over-Parameterized Network)，这个超网络可以包括复杂多样的网络结构。

2)搜索算法

本申请实施例的目标是从上述超网络中寻找到效果最好的一种网络结构。每个搜索块中包含

种局部结构，其中，i∈[1,2,...,B]，通过在每个搜索块中选择出一个局部结构，组合所有局部结构即可确定出一个完整的网络结构。定义一个完整的网络结构为

表示B个采样动作所确定出的B个局部结构，w _u表示该网络结构的网络参数(网络参数是指网络结构中各模块进行计算时的参数，例如公式1中的w ^k)。

对于结构参数的优化，设定采样动作u _i(i∈[1,2,...,B])采样自一个由结构参数

(i∈[1,2,...,B])决定的多项式分布，其中，结构参数α _i用于表征第i个搜索块中局部结构被采样的可能性，例如第i个搜索块包括N个局部结构，则结构参数α _i为N维向量，其中结构参数α _i中的值越大，则该值对应的局部结构被采样的可能性越大，其计算公式如公式(2)、(3)所示：

u _i～multinomial(p _i) (2)

p _i＝softmax(α _i) (3)

其中，multinomial()表示多项式分布，softmax()表示逻辑回归函数，p _i表示第i个搜索块中局部结构被采样的概率。因此，通过对B个多项式分布进行采样，可以得到一个完整的网络结构。为了能够应对不可微分的评价指标，本申请实施例使用强化学习策略梯度(REINFORCE)算法来优化结构参数。在结构参数的优化过程中，在指定评价指标上表现好的网络结构会具有更高的采样概率，其结构参数的优化目标的公式如公式(4)所示：

其中，p(α)表示由结构参数α确定的多项式分布，R _val表示采样到的结构在某个特定指标(例如，准确率、ROC曲线下方的面积大小(Area Under Curve，AUC)、损失等)上的得分(评估结果)。根据REINFORCE算法，结构参数的梯度通过如下公式(5)获得：

其中，b表示用来降低回报方差的基准，可以采用移动平均值作为基准，b也可以为0。

如图10所示，在每一次迭代的过程中，从超网络中采样出一个候选的网络结构，然后交替训练结构参数以及相应的网络参数，随着迭代的进行，表现优秀的网络结构的被采样的概率会增大。在搜索完成之后，在每一个搜索块中选择出最大概率的局部结构，从而组合所有最大概率的局部结构，以获得完成网络结构。其中，搜索过程以及获得最优网络结构的伪代码如下算法1所示：

算法1：搜索过程以及获得最优网络结构

输入：训练样本数据、验证数据以及包括B个搜索块的超网络

输出：优化的结构参数α和网络参数w

初始化结构参数α和网络参数w

while结构参数α和网络参数w不收敛do

for在超网络中的搜索块

do

通过公式(3)计算局部结构被采样的概率

通过公式(2)采样局部结构u _i

end for

获得一个网络结构

其中，

通过梯度下降

更新网络参数w

通过梯度上升公式(5)更新结构参数α

end while

return基于优化的结构参数α和网络参数w，获得最终的网络结构

因此，通过输入训练样本数据、验证数据以及包括B个搜索块的超网络，可以得到优化的结构参数α和网络参数w，并基于优化的结构参数α和网络参数w，获得最终的网络结构，以作为多任务学习模型。

综上，本申请实施例可以高效地对指定多任务数据集进行网络结构的寻优，自动地平衡不同任务分支的独立与共享关系，从而搜索到更好的网络结构，以作为多任务学习模型。多任务学习在推荐系统中非常重要，可用于业务推荐场景下多任务学习(多个分发指标预估：如预估点击率与完成度等目标)中的网络结构寻优，充分利用不同任务(指标)中蕴含的领域知识提升多任务学习模型的泛化能力，从而快速且准确的获得推荐系统的特定指标。相比于以人工试错的方式去设计网络结构，本申请实施例可以更高效地针对具体业务的训练数据学习到最合适的网络结构，加速产品迭代升级。

至此已经说明本申请实施例提供的构建多任务学习模型的方法，下面继续说明本申请实施例提供的构建多任务学习模型的装置555中各个模块配合实现构建多任务学习模型的方案。

构建模块5551，用于在输入节点与多个任务节点之间，通过将子网络层与搜索层交错排布的方式，构建由多个所述子网络层以及多个所述搜索层构成的搜索空间；采样模块5552，用于对从所述输入节点、经由所述搜索空间而到达每个所述任务节点的路径进行采样，得到候选路径，并作为候选网络结构；生成模块5553，用于根据样本数据，对所述候选网络结构的参数进行训练，生成用于进行多个任务预测的多任务学习模型。

在一些实施例中，所述构建模块5551还用于对所述子网络层中的多个子网络模块的输出进行抽样处理，得到多个抽样后所述子网络模块的输出；根据所述多个子网络模块中各子网络模块的权重，对多个抽样后的所述多个子网络模块的输出进行加权求和，将加权求和的结果作为搜索块中的局部结构的输出，以构建所述搜索块的传输路径；其中，所述搜索块为与所述子网络层相邻的搜索层中的模块。

在一些实施例中，所述搜索块还包括门控节点；所述构建模块5551还用于从所述子网络层的信号源集合中采样一个信号源，所述信号源为所述输入节点的输出或所述子网络层的前驱子网络模块的输出；通过所述门控节点对所述信号源进行预测处理，得到所述多个子网络模块中各子网络模块的预测值；对所述各子网络模块的预测值进行归一化处理，得到所述各子网络模块的权重。

在一些实施例中，所述搜索空间包括N个子网络层以及N个搜索层，其中，N为大于1的自然数；所述构建模块5551还用于通过第1个搜索层中的第i个搜索块，从第1个子网络层中采样出多个子网络模块的输出，其中，i为正整数，并当所述信号源为所述输入节点的输出时，根据所述多个子网络模块中各子网络模块的权重，对所述多个子网络模块的输出进行加权求和，将加权求和的结果作为第i个搜索块中的局部结构的输出，以构建所述第i个搜索块中的传输路径，直至完成所述第1个搜索层中的第i个搜索块中所有局部结构的传输路径的构建；通过第j个搜索层中的第i个搜索块，从第j个子网络层中采样出多个子网络模块的输出，其中，1<j≤N，j为自然数，并当所述信号源为所述输入节点或者第j个子网络层的前驱子网络模块的输出时，根据所述多个子网络模块中各子网络模块的权重，对所述多个子网络模块的输出进行加权求和，将加权求和的结果作为第j个搜索层中的第i个搜索块中的局部结构的输出，以构建所述第j个搜索层中的第i个搜索块中的传输路径，直至完成所述第j个搜索层中的第i个搜索块中所有局部结构的传输路径的构建。

在一些实施例中，当所述搜索层的后驱节点为所述子网络层中的子网络模块时，所述搜索层中的搜索块的输出为所述子网络模块的输入；当所述搜索层的后驱节点为所述任务节点时，所述搜索层中的搜索块的输出为所述任务节点的输入。

在一些实施例中，所述构建模块5551还用于将所述输入节点到第一子网络层的传输路径、中间的所述子网络层到相邻的所述搜索层的传输路径以及最后一个搜索层到所述任务节点的传输路径，作为有向图的边；将多个所述子网络层中的子网络模块以及多个所述搜索层中的搜索块，作为所述有向图的节点；对所述有向图的节点以及边进行组合，得到用于多任务学习的搜索空间。

在一些实施例中，所述采样模块5552还用于根据所述搜索空间的结构参数，对所述搜索空间中搜索层的每个搜索块进行采样，得到对应所述每个搜索块的局部结构；将从所述输入节点、经由所述每个搜索块的局部结构而到达每个所述任务节点的路径作为候选路径。

在一些实施例中，所述采样模块5552还用于对所述搜索空间的结构参数进行映射处理，得到对应所述搜索空间中每个搜索块中的局部结构的采样概率；根据所述每个搜索块中的局部结构的采样概率，构建所述每个搜索块的多项式分布；对所述每个搜索块的多项式分布进行采样处理，得到对应所述每个搜索块的局部结构。

在一些实施例中，所述生成模块5553还用于根据优化后的所述候选网络结构的网络参数，对所述搜索空间的结构参数进行训练，得到优化后的所述搜索空间的结构参数；根据优化后的所述搜索空间的结构参数，从各优化后的所述候选网络结构中确定出用于进行多个任务预测的候选网络结构，并作为所述多任务学习模型。

在一些实施例中，所述生成模块5553还用于通过所述候选网络结构对所述样本数据进行多任务预测处理，得到所述样本数据的多任务的预测结果；根据所述多任务的预测结果以及所述样本数据的多任务标签，构建所述候选网络结构的损失函数；更新所述候选网络结构的网络参数直至所述损失函数收敛，将所述损失函数收敛时所述候选网络结构的更新的参数，作为优化后的所述候选网络结构的网络参数。

在一些实施例中，所述生成模块5553还用于通过所述样本数据以及优化后的所述候选网络结构的网络参数进行网络结构的评估处理，得到优化后的所述候选网络结构的评估结果；根据所述评估结果，构建所述搜索空间的结构参数的目标函数；更新所述搜索空间的结构参数直至所述目标函数收敛，将所述目标函数收敛时所述搜索空间的更新的结构参数，作为优化后的搜索空间的结构参数。

在一些实施例中，所述生成模块5553还用于对优化后的所述搜索空间的结构参数进行映射处理，得到对应所述搜索空间中每个搜索块中的局部结构的采样概率；将所述每个搜索块中的局部结构的最大采样概率对应的局部结构，作为用于进行多个任务预测的候选网络结构的局部结构；将每个所述候选网络结构的局部结构进行组合，得到所述多任务学习模型。

以上所述，仅为本申请的实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本申请的保护范围之内。

Claims

一种构建多任务学习模型的方法，所述方法包括：

在输入节点与多个任务节点之间，通过将子网络层与搜索层交错排布的方式，构建由多个所述子网络层以及多个所述搜索层构成的搜索空间；

对从所述输入节点、经由所述搜索空间而到达每个所述任务节点的路径进行采样，得到候选路径，并作为候选网络结构；

根据样本数据，对所述候选网络结构的参数进行训练，生成用于进行多个任务预测的多任务学习模型。
根据权利要求1所述的方法，其中，所述构建由多层的子网络层以及多层的搜索层构成的搜索空间之前，所述方法还包括：

对所述子网络层中的多个子网络模块的输出进行抽样处理，得到多个抽样后的所述子网络模块的输出；

根据所述多个子网络模块中各子网络模块的权重，对多个抽样后的所述子网络模块的输出进行加权求和，将加权求和的结果作为搜索块的局部结构的输出，以构建所述搜索块的传输路径；

其中，所述搜索块为与所述子网络层相邻的搜索层中的模块。
根据权利要求2所述的方法，其中，

所述搜索块还包括门控节点；

所述对所述子网络层中的多个子网络模块的输出进行抽样处理之后，所述方法还包括：

从所述子网络层的信号源集合中采样一个信号源，所述信号源为所述输入节点的输出或所述子网络层的前驱子网络模块的输出；

通过所述门控节点对所述信号源进行预测处理，得到所述多个子网络模块中各子网络模块的预测值；

对所述各子网络模块的预测值进行归一化处理，得到所述各子网络模块的权重。
根据权利要求3所述的方法，其中，

所述搜索空间包括N个子网络层以及N个搜索层，其中，N为大于1的自然数；

所述构建由多层的子网络层以及多层的搜索层构成的搜索空间之前，所述方法还包括：

通过第1个搜索层中的第i个搜索块，从第1个子网络层中采样出多个子网络模块的输出，其中，i为正整数，并

当所述信号源为所述输入节点的输出时，根据所述多个子网络模块中各子网络模块的权重，对所述多个子网络模块的输出进行加权求和，将加权求和的结果作为第i个搜索块中的局部结构的输出，以构建所述第i个搜索块中的传输路径，直至完成所述第1个搜索层中的第i个搜索块中所有局部结构的传输路径的构建；

通过第j个搜索层中的第i个搜索块，从第j个子网络层中采样出多个子网络模块的输出，其中，1<j≤N，j为自然数，并

当所述信号源为所述输入节点或者第j个子网络层的前驱子网络模块的输出时，根据所述多个子网络模块中各子网络模块的权重，对所述多个子网络模块的输出进行加权求和，将加权求和的结果作为第j个搜索层中的第i个搜索块中的局部结构的输出，以构建所述第j个搜索层中的第i个搜索块中的传输路径，直至完成所述第j个搜索层中的第i个搜索块中所有局部结构的传输路径的构建。
根据权利要求1所述的方法，其中，

当所述搜索层的后驱节点为所述子网络层中的子网络模块时，所述搜索层中的搜索块的输出为所述子网络模块的输入；

当所述搜索层的后驱节点为所述任务节点时，所述搜索层中的搜索块的输出为所述任务节点的输入。
根据权利要求1所述的方法，其中，所述构建由多个所述子网络层以及多个所述搜索层构成的搜索空间，包括：

将所述输入节点到第一个子网络层的传输路径、中间的所述子网络层到相邻的所述搜索层的传输路径以及最后一个搜索层到所述任务节点的传输路径，作为有向图的边；

将多个所述子网络层中的子网络模块以及多个所述搜索层中的搜索块，作为所述有向图的节点；

对所述有向图的节点以及边进行组合，得到用于多任务学习的搜索空间。
根据权利要求1所述的方法，其中，所述对从所述输入节点、经由所述搜索空间而到达每个所述任务节点的路径进行采样，得到候选路径，包括：

根据所述搜索空间的结构参数，对所述搜索空间中搜索层的每个搜索块进行采样，得到对应所述每个搜索块的局部结构；

将从所述输入节点、经由所述每个搜索块的局部结构而到达每个所述任务节点的路径作为候选路径。
根据权利要求7所述的方法，其中，所述根据所述搜索空间的结构参数，对所述搜索空间中搜索层的每个搜索块进行采样，得到对应所述每个搜索块的局部结构，包括：

对所述搜索空间的结构参数进行映射处理，得到对应所述搜索空间中每个搜索块中的局部结构的采样概率；

根据所述每个搜索块中的局部结构的采样概率，构建所述每个搜索块的多项式分布；

对所述每个搜索块的多项式分布进行采样处理，得到对应所述每个搜索块的局部结构。
根据权利要求1所述的方法，其中，所述对所述候选网络结构的参数进行训练，生成用于进行多个任务预测的多任务学习模型，包括：

对所述候选网络结构的网络参数进行训练，得到优化后的所述候选网络结构的网络参数；

根据优化后的所述候选网络结构的网络参数，对所述搜索空间的结构参数进行训练，得到优化后的所述搜索空间的结构参数；

根据优化后的所述搜索空间的结构参数，从各优化后的所述候选网络结构中确定出用于进行多个任务预测的候选网络结构，并作为所述多任务学习模型。
根据权利要求9所述的方法，其中，所述对所述候选网络结构的网络参数进行训练，得到优化后的所述候选网络结构的网络参数，包括：

通过所述候选网络结构对所述样本数据进行多任务预测处理，得到所述样本数据的多任务的预测结果；

根据所述多任务的预测结果以及所述样本数据的多任务标签，构建所述候选网络结构的损失函数；

更新所述候选网络结构的网络参数直至所述损失函数收敛，将所述损失函数收敛时所述候选网络结构的更新的参数，作为优化后的所述候选网络结构的网络参数。
根据权利要求9所述的方法，其中，所述根据优化后的所述候选网络结构的网络参数，对所述搜索空间的结构参数进行训练，得到优化后的搜索空间的结构参数，包括：

通过所述样本数据以及优化后的所述候选网络结构的网络参数进行网络结构的评估处理，得到优化后的所述候选网络结构的评估结果；

根据所述评估结果，构建所述搜索空间的结构参数的目标函数；

更新所述搜索空间的结构参数直至所述目标函数收敛，将所述目标函数收敛时所述搜索空间的更新的结构参数，作为优化后的搜索空间的结构参数。
根据权利要求9所述的方法，其中，所述根据优化后的所述搜索空间的结构参数，从各优化后的所述候选网络结构中确定出用于进行多个任务预测的候选网络结构，并作为所述多任务学习模型，包括：

对优化后的所述搜索空间的结构参数进行映射处理，得到对应所述搜索空间中每个搜索块中的局部结构的采样概率；

将所述每个搜索块中的局部结构的最大采样概率对应的局部结构，作为用于进行多个任务预测的候选网络结构的局部结构；

将每个所述候选网络结构的局部结构进行组合，得到所述多任务学习模型。
一种构建多任务学习模型的装置，所述装置包括：

构建模块，用于在输入节点与多个任务节点之间，通过将子网络层与搜索层交错排布的方式，构建由多个所述子网络层以及多个所述搜索层构成的搜索空间；

采样模块，用于对从所述输入节点、经由所述搜索空间而到达每个所述任务节点的路径进行采样，得到候选路径，并作为候选网络结构；

生成模块，用于根据样本数据，对所述候选网络结构的参数进行训练，生成用于进行多个任务预测的多任务学习模型。
一种电子设备，所述电子设备包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至12任一项所述的构建多任务学习模型的方法。
一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现权利要求1至12任一项所述的构建多任务学习模型的方法。