CN114968520B

CN114968520B - 任务搜索方法及装置、服务器和存储介质

Info

Publication number: CN114968520B
Application number: CN202210548133.7A
Authority: CN
Inventors: 郑辉煌; 陈特峰; 陈浩泽; 王悦; 王震; 刘益群; 孙黎; 姜程; 石晓伟; 蓝翔
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-05-19
Filing date: 2022-05-19
Publication date: 2023-11-24
Anticipated expiration: 2042-05-19
Also published as: WO2023221371A1; CN114968520A

Abstract

本公开公开了任务搜索方法及装置、服务器和存储介质，涉及计算机技术领域，尤其涉及深度学习技术领域。具体实现方案为：获取与初始任务对应的任务调度策略，其中，任务调度策略包括推理时长任务调度策略和训练任务调度策略，推理时长任务调度策略用于调节推理场景下初始任务对应的推理时长，训练任务调度策略用于调节训练场景下初始任务对应的搜索时长；获取初始任务对应的训练运行方式；采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务。本公开实施例可以降低搜索时长，提高任务搜索方案的适用性。

Description

任务搜索方法及装置、服务器和存储介质

技术领域

本公开涉及计算机技术领域，尤其涉及一种任务搜索方法及装置、服务器和存储介质。

背景技术

深度学习是机器学习领域中的一个研究方向，其可以学习样本数据的内在规律和表示层次，从而可以使机器模仿视听和思考等人类的活动。相关技术中，可以采用深度学习编译器对深度学习模型进行训练和推理。然而，相关技术中，采用深度学习编译器对深度学习模型进行自动优化时需要的搜索时长较长，不适用于训练场景。

发明内容

本公开提供了一种任务搜索方法及装置、服务器和存储介质，主要目的在于降低搜索时长，提高任务搜索方案的适用性。

根据本公开的一方面，提供了一种任务搜索方法，包括：

获取与初始任务对应的任务调度策略，其中，所述任务调度策略包括推理时长任务调度策略和训练任务调度策略，所述推理时长任务调度策略用于调节推理场景下所述初始任务对应的推理时长，所述训练任务调度策略用于调节训练场景下所述初始任务对应的搜索时长；

获取所述初始任务对应的训练运行方式；

采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务。

根据本公开的另一方面，提供了一种任务搜索装置，包括：

策略获取单元，用于获取与初始任务对应的任务调度策略，其中，所述任务调度策略包括推理时长任务调度策略和训练任务调度策略，所述推理时长任务调度策略用于调节推理场景下所述初始任务对应的推理时长，所述训练任务调度策略用于调节训练场景下所述初始任务对应的搜索时长；

方式获取单元，用于获取所述初始任务对应的训练运行方式；

任务获取单元，用于采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务。

根据本公开的另一方面，提供了一种服务器，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行前述一方面中任一项所述的方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行前述一方面中任一项所述的方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现前述一方面中任一项所述的方法。

在本公开一个或多个实施例中，通过获取与初始任务对应的任务调度策略，其中，所述任务调度策略包括推理时长任务调度策略和训练任务调度策略，所述推理时长任务调度策略用于调节推理场景下所述初始任务对应的推理时长，所述训练任务调度策略用于调节训练场景下所述初始任务对应的搜索时长；获取所述初始任务对应的训练运行方式；采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务。因此可以降低搜索时长，提高任务搜索方案的适用性。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开第一实施例的任务搜索方法的流程示意图；

图2是根据本公开第二实施例的任务搜索方法的流程示意图；

图3是根据本公开实施例提供的推理时长任务调度策略的选择流程图；

图4a是用来实现本公开实施例的任务搜索方法的第一种任务搜索装置的结构示意图；

图4b是用来实现本公开实施例的任务搜索方法的第二种任务搜索装置的结构示意图；

图4c是用来实现本公开实施例的任务搜索方法的第三种任务搜索装置的结构示意图；

图4d是用来实现本公开实施例的任务搜索方法的第四种任务搜索装置的结构示意图；

图4e是用来实现本公开实施例的任务搜索方法的第五种任务搜索装置的结构示意图；

图4f是用来实现本公开实施例的任务搜索方法的第六种任务搜索装置的结构示意图；

图5是用来实现本公开实施例的任务搜索方法的服务器的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

随着科学技术的发展，服务器技术的日益成熟，提高了用户生产生活的便利性。服务器应用场景中，用户可以通过服务器对深度学习模型进行训练和推理。

根据一些实施例，深度学习编译器是一种用于解决多种硬件平台和深度学习对接问题的编译器软件。深度学习编译器可以由多层中间表达(IntermediateRepresentation，IR)及对应的运行方式组成。其中，高层中间表达用来表达深度学习计算图结构，其包含深度学习的变量(Variable)，算子(Operator)的表示。低层中间表示则是算子的具体计算，比如高层中间表示的矩阵乘算子，在底层中间表示则是更具体的循环、求乘、求和操作，这些操作也更接近硬件的低层指令。

在一些实施例中，服务器中可以设置深度学习编译器。进而，服务器在对深度学习模型进行训练和推理时，可以采用深度学习编译器搜索与深度学习模型匹配的配置。

在一些实施例中，服务器采用深度学习编译器搜索与深度学习模型匹配的配置时，需要将经过深度学习优化后的计算图输入至深度学习编译器以供深度学习编译器搜索。

然而，深度学习编译器对计算图进行搜索时，由于需要尝试和搜索不同的优化配置，搜索量大，整个计算图都需要进行搜索尝试。因此，服务器进行搜索的时间较长。

易于理解的是，在对深度学习模型进行推理时，可以通过离线耗费时间来进行搜索，然后再上线对深度学习模型进行推理。然而，在对深度学习模型进行训练时，用户需要通过深度学习模型的训练迭代了解深度学习模型的训练效果，如果搜索时间过长会增加深度学习模型的训练时长。由于自动优化技术需要的优化时间长，往往数十小时，仅适用深度学习推理场景，但是在训练场景上适用性则较差。

下面结合具体的实施例对本公开进行详细说明。

在第一个实施例中，如图1所示，图1是根据本公开第一实施例的任务搜索方法的流程示意图，该方法可依赖于计算机程序实现，可运行于进行任务搜索的装置上，可以是具有任务搜索功能的服务器。该计算机程序可集成在应用中，也可作为独立的工具类应用运行。

具体的，该任务搜索方法包括：

S101，获取与初始任务对应的任务调度策略；

根据一些实施例，任务Task指的是深度学习神经网络模型进行训练推理时，使用的计算图子图。该任务并不特指某一固定任务。例如，当计算图发生变化时，该任务可以发生变化。当计算图子图发生变化时，该任务也可以发生变化。

在一些实施例中，初始任务指的是需要进行调优搜索的任务。该初始任务并不特指某一固定任务。例如，当计算图发生变化时，该初始任务可以发生变化。当计算图子图发生变化时，该初始任务也可以发生变化。

根据一些实施例，任务调度策略指的是服务器对初始任务进行搜索时所采用的策略。该任务调度策略包括但不限于推理时长任务调度策略、训练任务调度策略等等。该任务调度策略并不特指某一固定策略。例如，当初始任务发生变化时，该任务调度策略可以发生变化。当计算图发生变化时，该任务调度策略也可以发生变化。

在一些实施例中，推理时长任务调度策略指的是用于调节推理场景下初始任务对应的推理时长的策略。该推理时长任务调度策略并不特指某一固定策略。例如，当任务调度策略发生变化时，该推理时长任务调度策略可以发生变化。当初始任务发生变化时，该推理时长任务调度策略也可以发生变化。

在一些实施例中，训练任务调度策略指的是用于调节训练场景下初始任务对应的搜索时长的策略。该训练任务调度策略并不特指某一固定策略。例如，当任务调度策略发生变化时，该训练任务调度策略可以发生变化。当初始任务发生变化时，该训练任务调度策略也可以发生变化。

易于理解的是，当服务器进行任务搜索时，服务器可以获取与初始任务对应的任务调度策略。

S102，获取初始任务对应的训练运行方式；

根据一些实施例，训练运行方式指的是服务器对深度学习神经网络模型进行训练时，采用的训练运行方式。该训练运行方式并不特指某一固定方式。例如，当深度学习神经网络模型发生变化时，该训练运行方式可以发生变化。当初始任务发生变化时，该训练运行方式也可以发生变化。

易于理解的是，当服务器获取到与初始任务对应的任务调度策略时，服务器可以获取初始任务对应的训练运行方式。

S103，采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务。

根据一些实施例，目标任务指的是对初始任务进行调优搜索后得到的任务。该目标任务并不特指某一固定任务。例如，当初始任务发生变化时，该目标任务可以发生变化。当任务调度策略发生变化时，该目标任务也可以发生变化。

易于理解的是，当服务器获取到初始任务对应的训练运行方式时，服务器可以采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务。

在本公开实施例中，通过获取与初始任务对应的任务调度策略；获取初始任务对应的训练运行方式；采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务。因此通过采用推理时长任务调度策略，可以减少对深度学习模型进行推理时的任务搜索时长，可以减少深度学习模型的推理时长，同时，通过采用训练任务调度策略和训练运行方式，可以减少对深度学习模型进行训练时的任务搜索时长，可以减少深度学习模型的训练时长，进而，可以减少任务搜索的时长的同时提高任务搜索方案的适用性，使得该任务搜索方法可以适用于推理场景和训练场景。

请参见图2，图2是根据本公开第二实施例的任务搜索方法的流程示意图。具体的

S201，若确定缓存中存在与初始任务对应的第二目标配置信息，则基于第二目标配置信息获取硬件代码；

根据一些实施例，目标配置信息指的是任务对应的调优配置信息。该目标配置信息并不特指某一固定信息。该目标配置信息包括但不限于循环分块大小、向量化、循环展开、计算位置调整、线程并行、图形处理器(graphics processing unit，GPU)并行等等。

在一些实施例中，第二目标配置信息指的是初始任务对应的调优配置信息。该第二目标配置信息并不特指某一固定信息。例如，当初始任务发生变化时，该第二目标配置信息可以发生变化。当服务器获取到针对第二目标配置信息的信息修改指令时，该第二目标配置信息也可以发生变化。

在一些实施例中，硬件代码指的是在硬件上运行生成的代码。该硬件代码并不特指某一固定代码。例如，当第二目标配置信息发生变化时，该硬件代码可以发生变化。当初始任务发生变化时，该硬件代码也可以发生变化。

在一些实施例中，当服务器基于第二目标配置信息获取硬件代码时，服务器可以将第二目标配置信息转化为底层IR。进而，服务器可以通过底层IR生成硬件代码。

易于理解的是，当服务器进行任务搜索时，若服务器确定缓存中存在与初始任务对应的第二目标配置信息，则服务器可以基于第二目标配置信息获取硬件代码。

根据一些实施例，服务器可以对计算图进行划分，得到至少一个任务。

S202，控制硬件运行硬件代码，获取初始任务对应的运行信息；

根据一些实施例，运行信息指的是初始任务在硬件中的运行信息。该运行信息并不特指某一固定运行信息。该运行信息包括运行速度。例如，当初始任务发生变化时，该运行信息可以发生变化。当硬件代码发生变化时，该运行信息也可以发生变化。

在一些实施例中，当服务器进行任务搜索时，服务器需要对目标配置信息进行排列组合，搜索出使任务对应的运行速度最低的排列组合。

在一些实施例中，服务器需要对目标配置信息进行排列组合，搜索出使任务对应的运行速度最低的排列组合时，采用的搜索算法包括但不限于遗传搜索算法，穷举搜索算法、网格搜索算法等等。

在一些实施例中，服务器还可以直接从搜索空间中，搜索出使任务对应的运行速度最低的排列组合。其中，搜索空间指的是包括目标配置信息对应的所有可运行排列组合的空间。

根据一些实施例，当服务器控制硬件运行硬件代码，获取初始任务对应的运行信息时，若服务器判断该运行信息符合运行信息条件。则服务器可以结束对初始任务的搜索，并将该初始任务设置为目标任务。

在一些实施例中，运行信息条件指的是服务器用于判断初始任务是否需要进行调优搜索时采用的条件。该运行信息条件并不特指某一固定条件。例如，当服务器获取到针对运行信息条件的条件修改指令时，该运行信息条件可以发生变化。

易于理解的是，当服务器基于第二目标配置信息获取硬件代码时，服务器可以控制硬件运行硬件代码。进而，服务器可以获取初始任务对应的运行信息。

S203，在展示界面上展示与初始任务对应的推理时长任务调度策略集合；

根据一些实施例，展示界面指的是服务器与用户进行人机交互时采用的展示界面。该展示界面并不特指某一固定界面。例如，当服务器发生变化时，该展示界面可以发生变化。

在一些实施例中，推理时长任务调度策略集合指的是由至少一个推理时长任务调度策略汇聚而成的集合。该推理时长任务调度策略集合并不特指某一固定集合。例如，当推理时长任务调度策略对应的推力时长发生变化时，该推理时长任务调度策略集合可以发生变化。当推理时长任务调度策略的数量发生变化时，该推理时长任务调度策略集合可以发生变化。

在一些实施例中，不同的推理时长任务调度策略对应的推理时长和任务对应的速度提升值不同。例如，推理时长任务调度策略例如可以是10％的搜索时长对应90％的速度提升值；例如，推理时长任务调度策略例如可以是20％的搜索时长对应92％的速度提升值；例如，推理时长任务调度策略例如可以是100％的搜索时长对应100％的速度提升值。

在一些实施例中，该推理时长任务调度策略集合包括至少一个推理时长任务调度策略，该推理时长任务调度策略包括但不限于长时任务调度策略、短时任务调度策略等等。其中，长时任务调度策略的推理时长大于短时任务调度策略的推理时长。长时任务调度策略的推理性能高于短时任务调度策略的推理性能。

易于理解的是，当服务器进行任务搜索时，服务器可以在展示界面上展示与初始任务对应的推理时长任务调度策略集合。

S204，获取针对推理时长任务调度策略集合所输入的选择指令；

根据一些实施例，选择指令指的是终端获取到的用户选择推理时长任务调度策略时输入的指令。该选择指令并不特指某一固定指令。该选择指令包括但不限于语音选择指令、点击选择指令等等。例如，当服务器检测到用户说出任一推理时长任务调度策略对应的语音信息时，则服务器可以获取到该推理时长任务调度策略对应的选择指令。当服务器检测到用户点击任一推理时长任务调度策略对应的选择按键时，则服务器也可以获取到该推理时长任务调度策略对应的选择指令。

易于理解的是，当服务器在展示界面上展示与初始任务对应的推理时长任务调度策略集合时，服务器可以获取针对推理时长任务调度策略集合所输入的选择指令。

S205，获取选择指令对应的推理时长任务调度策略，获取训练任务调度策略；

根据一些实施例，图3是根据本公开实施例提供的推理时长任务调度策略的选择流程图。如图3所示。服务器在展示界面上展示推理时长任务调度策略集合。其中，推理时长任务调度策略集合包括长时任务调度策略和短时任务调度策略。当服务器检测到用户点击短时任务调度策略时，服务器可以获取到针对短时任务调度策略所输入的选择指令。进而，服务器可以设置推理时长任务调度策略为短时任务调度策略。

易于理解的是，当服务器获取到针对推理时长任务调度策略集合所输入的选择指令时，服务器可以获取选择指令对应的推理时长任务调度策略。

S206，获取初始任务对应的训练运行方式；

具体过程如上所述，此处不再赘述。

根据一些实施例，初始任务对应的训练运行方式包括但不限于整体训练运行方式、交叉训练运行方式等等。

在一些实施例中，当服务器采用整体训练运行方式时，服务器可以先对所有任务进行调优搜索，之后再对模型进行训练。

在一些实施例中，当服务器采用交叉训练运行方式时，服务器可以对模型训练一次后进行一次任务调优。

S207，采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务；

具体过程如上所述，此处不再赘述。

根据一些实施例，采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索时，服务器可以获取训练场景下初始任务对应的优化潜力值。进而，服务器可以根据该优化潜力值进行任务搜索。

在一些实施例中，优化潜力值用于指示任务的优化潜力。该优化潜力值并不特指某一固定值。例如，当任务发生变化时，该优化潜力值可以发生变化。该优化潜力值可以基于导数或者贝叶斯模型获取。

在一些实施例中，当服务器获取到初始任务对应的优化潜力值时，若服务器判断优化潜力值小于潜力阈值，则服务器可以停止对初始任务进行搜索，即为训练早搜早停任务调度策略。因此可以停止对优化潜力值小于潜力阈值的任务进行搜索，从而可以减少任务搜索时长。

在一些实施例中，潜力阈值指的是服务器用于评估任务是否具备优化潜力时采用的阈值。该潜力阈值并不特指某一固定阈值。例如，当终端获取到针对潜力阈值的阈值修改指令时，该潜力阈值可以发生变化。

在一些实施例中，当服务器获取到初始任务对应的优化潜力值时，服务器还可以获取与优化潜力值对应的时间资源信息。进而，服务器可以对初始任务分配与时间资源信息对应的搜索时长。因此可以针对任务对应的优化潜力值，对搜索时长进行分配，进而可以提高任务搜索的效率，可以减少总任务搜索的时长。

根据一些实施例，当服务器采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务时，服务器可以获取控制初始任务迭代运行训练样本数据的第一运行时间，以及获取控制硬件运行训练样本数据的第二运行时间。

在一些实施例中，第一运行时间和第二运行时间存在重合运行时间。也就是说，初始任务迭代运行训练样本数据的时间与控制硬件运行训练样本数据的时间存在重合，可以是全部重合或者部分重合。因此，可以减少任务搜索时间。

根据一些实施例，服务器可以确定搜索算法，该搜索算法用于对不同的运行配置进行排列组合，包括但不限于对循环分块大小、向量化、循环展开、计算位置调整等。服务器可以采用机器学习的cost model来预测优化配置的运行速度，选取其中较快者进行真实硬件运行，测量真实速度快的配置作为优化结果。根据系统不同，有不同的搜索算法，比如遗传搜索算法，穷举搜索算法、网格(Grid)搜索算法等。

根据一些实施例，代价Cost数据数据库Database是指用来训练代价模型CostModel的硬件真实运行速度的数据的DataBase，用来训练更精确的Cost Model。该CostModel可以用于确定搜索算法。服务器可以用机器学习的Cost Model来预测优化配置的运行速度，可以加快搜索算法的搜索速度，减少自动调优时间。同时将硬件上任务运行的真实速度反馈给Cost Model进行机器学习训练，以对Cost Model进行优化。

在一些实施例中，服务器可以在矩阵循环中使用环分块大小、向量化、循环展开、计算位置调整、线程并行、GPU并行等优化方法。这些基础的优化方法在自动调优系统中被称为调度原语schedule primitive，基础优化方法的排列组合组成的所有可运行组合叫搜索空间。服务器可以采用搜索算法在该搜索空间里去搜索速度快的任务运行方法。

S208，获取并存储目标任务对应的第一目标配置信息。

根据一些实施例，第一目标配置信息指的是目标任务对应的调优配置信息。该第一目标配置信息并不特指某一固定信息。例如，当目标任务发生变化时，该第一目标配置信息可以发生变化。

在一些实施例中，当服务器进行模型训练时，若服务器获取到目标任务对应的第一目标配置信息，则服务器可以存储该第一目标配置信息。进而，当服务器对深度学习模型进行推理时，可以复用该第一目标配置信息，进而可以减少模型推理时的任务搜索时长。

易于理解的是，当服务器获取到目标任务时，服务器可以获取并存储目标任务对应的第一目标配置信息。

在本公开实施例中，首先，通过若确定缓存中存在与初始任务对应的第二目标配置信息，则基于第二目标配置信息获取硬件代码；控制硬件运行硬件代码，获取初始任务对应的运行信息；因此若根据所缓存的配置信息判断无需继续对初始任务进行搜索，则可以减少对初始任务进行搜索所需要的时长，进而可以减少任务搜索时长。其次，通过在展示界面上展示与初始任务对应的推理时长任务调度策略集合；获取针对推理时长任务调度策略集合所输入的选择指令；获取选择指令对应的推理时长任务调度策略；因此可以根据需求选择需要的推理时长任务调度策略，可以提高任务搜索的灵活性。接着，通过获取初始任务对应的训练运行方式；采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务；因此通过采用推理时长任务调度策略，可以减少对深度学习模型进行推理时的任务搜索时长，进而可以减少深度学习模型的推理时长。通过采用训练任务调度策略和训练运行方式，可以减少对深度学习模型进行训练时的任务搜索时长，进而可以减少深度学习模型的训练时长，进而，可以减少任务搜索的时长的同时提高任务搜索方案的适用性，使得该任务搜索方法可以适用于推理场景和训练场景。最后，通过获取并存储目标任务对应的第一目标配置信息；因此，当服务器对深度学习模型进行推理时，可以复用第一目标配置信息，进而可以减少模型推理时的任务搜索时长。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。

请参见图4a，其示出了本公开一个示例性实施例提供的第一种任务搜索装置的结构示意图。该任务搜索装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该任务搜索装置400包括策略获取单元401、方式获取单元402和任务获取单元403，其中：

策略获取单元401，用于获取与初始任务对应的任务调度策略，其中，任务调度策略包括推理时长任务调度策略和训练任务调度策略，推理时长任务调度策略用于调节推理场景下初始任务对应的推理时长，训练任务调度策略用于调节训练场景下初始任务对应的搜索时长；

方式获取单元402，用于获取初始任务对应的训练运行方式；

任务获取单元403，用于采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务。

根据一些实施例，图4b是用来实现本公开实施例的任务搜索方法的第二种任务搜索装置的结构示意图。如图4b所示，策略获取单元401包括集合展示子单元411、指令获取子单元421和策略获取子单元431，策略获取单元4001用于获取与初始任务对应的任务调度策略时：

集合展示子单元411，用于在展示界面上展示与初始任务对应的推理时长任务调度策略集合；

指令获取子单元421，用于获取针对推理时长任务调度策略集合所输入的选择指令；

策略获取子单元431，用于获取选择指令对应的推理时长任务调度策略。

根据一些实施例，图4c是用来实现本公开实施例的任务搜索方法的第三种任务搜索装置的结构示意图。如图4c所示，任务获取单元403包括潜力值获取子单元413和搜索停止子单元423，任务获取单元403用于采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务时：

潜力值获取子单元413，用于采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索时，获取训练场景下初始任务对应的优化潜力值；

搜索停止子单元423，用于若优化潜力值小于潜力阈值，则停止对初始任务进行搜索。

根据一些实施例，图4d是用来实现本公开实施例的任务搜索方法的第四种任务搜索装置的结构示意图。如图4d所示，任务搜索装置400还包括信息获取单元404和时长分配单元405，用于在获取初始任务对应的优化潜力值之后：

信息获取单元404，用于获取与优化潜力值对应的时间资源信息；

时长分配单元405，用于对初始任务分配与时间资源信息对应的搜索时长。

根据一些实施例，图4e是用来实现本公开实施例的任务搜索方法的第五种任务搜索装置的结构示意图。如图4e所示，任务搜索装置400还包括信息存储单元406，用于在采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务之后：

信息存储单元406，用于获取并存储目标任务对应的第一目标配置信息。

根据一些实施例，图4f是用来实现本公开实施例的任务搜索方法的第六种任务搜索装置的结构示意图。如图4f所示，任务搜索装置400还包括代码获取单元407和代码运行单元408，用于在获取与初始任务对应的任务调度策略之前：

代码获取单元407，用于若确定缓存中存在与初始任务对应的第二目标配置信息，则基于第二目标配置信息获取硬件代码；

代码运行单元408，用于控制硬件运行硬件代码，获取初始任务对应的运行信息。

根据一些实施例，任务获取单元404，用于采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务时，具体用于：

采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务时，获取控制初始任务迭代运行训练样本数据的第一运行时间，获取控制硬件运行训练样本数据的第二运行时间，其中，第一运行时间和第二运行时间存在重合运行时间。

要说明的是，上述实施例提供的任务搜索装置在执行任务搜索方法时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的任务搜索装置与任务搜索方法实施例属于同一构思，其体现实现过程详见方法实施例，这里不再赘述。

上述本公开实施例序号仅仅为了描述，不代表实施例的优劣。

在本公开实施例中，通过策略获取单元获取与初始任务对应的任务调度策略，其中，任务调度策略包括推理时长任务调度策略和训练任务调度策略，推理时长任务调度策略用于调节推理场景下初始任务对应的推理时长，训练任务调度策略用于调节训练场景下初始任务对应的搜索时长；方式获取单元获取初始任务对应的训练运行方式；任务获取单元采用推理时长任务调度策略、训练任务调度策略和训练运行方式对初始任务进行搜索，得到目标任务。因此通过采用推理时长任务调度策略，可以减少对深度学习模型进行推理时的任务搜索时长，进而可以减少深度学习模型的推理时长。通过采用训练任务调度策略和训练运行方式，可以减少对深度学习模型进行训练时的任务搜索时长，进而可以减少深度学习模型的训练时长。进而，可以减少任务搜索的时长的同时提高任务搜索方案的适用性，使得该任务搜索方法可以适用于推理场景和训练场景。

本公开的技术方案中，所涉及的用户个人信息的获取、存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种服务器、一种可读存储介质和一种计算机程序产品。

图5示出了可以用来实施本公开的实施例的示例服务器500的示意性框图。

如图5所示，服务器500包括计算单元501，其可以根据存储在只读存储器(ROM)502中的计算机程序或者从存储单元508加载到随机访问存储器(RAM)503中的计算机程序，来执行各种适当的动作和处理。在RAM 503中，还可存储服务器500操作所需的各种程序和数据。计算单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

服务器500中的多个部件连接至I/O接口505，包括：输入单元506，例如键盘、鼠标等；输出单元507，例如各种类型的显示器、扬声器等；存储单元508，例如磁盘、光盘等；以及通信单元509，例如网卡、调制解调器、无线通信收发机等。通信单元509允许服务器500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理，例如任务搜索方法。例如，在一些实施例中，任务搜索方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元508。在一些实施例中，计算机程序的部分或者全部可以经由ROM 502和/或通信单元509而被载入和/或安装到服务器500上。当计算机程序加载到RAM 503并由计算单元501执行时，可以执行上文描述的任务搜索方法的一个或多个步骤。备选地，在其他实施例中，计算单元501可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行任务搜索方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种任务搜索方法，包括：

获取所述初始任务对应的训练运行方式；

采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务；

其中，所述采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务，包括：

采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务时，获取控制所述初始任务迭代运行训练样本数据的第一运行时间，获取控制硬件运行所述训练样本数据的第二运行时间，其中，所述第一运行时间和所述第二运行时间存在重合运行时间。

2.根据权利要求1所述的方法，其中，所述获取与初始任务对应的任务调度策略，包括：

在展示界面上展示与所述初始任务对应的推理时长任务调度策略集合；

获取针对所述推理时长任务调度策略集合所输入的选择指令；

获取所述选择指令对应的推理时长任务调度策略。

3.根据权利要求1所述的方法，其中，所述采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务，包括：

采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索时，获取所述训练场景下所述初始任务对应的优化潜力值；

若所述优化潜力值小于潜力阈值，则停止对所述初始任务进行搜索。

4.根据权利要求3所述的方法，其中，在所述获取所述初始任务对应的优化潜力值之后，还包括：

获取与所述优化潜力值对应的时间资源信息；

对所述初始任务分配与所述时间资源信息对应的搜索时长。

5.根据权利要求1所述的方法，其中，在采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务之后，还包括：

获取并存储所述目标任务对应的第一目标配置信息。

6.根据权利要求1所述的方法，其中，在获取与初始任务对应的任务调度策略之前，还包括：

若确定缓存中存在与所述初始任务对应的第二目标配置信息，则基于所述第二目标配置信息获取硬件代码；

控制硬件运行所述硬件代码，获取所述初始任务对应的运行信息。

7.一种任务搜索装置，包括：

任务获取单元，用于采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务；

其中，所述任务获取单元，用于采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务时，具体用于：

8.根据权利要求7所述的装置，其中，所述策略获取单元包括集合展示子单元、指令获取子单元和策略获取子单元，所述策略获取单元用于获取与初始任务对应的任务调度策略时：

所述集合展示子单元，用于在展示界面上展示与所述初始任务对应的推理时长任务调度策略集合；

所述指令获取子单元，用于获取针对所述推理时长任务调度策略集合所输入的选择指令；

所述策略获取子单元，用于获取所述选择指令对应的推理时长任务调度策略。

9.根据权利要求7所述的装置，其中，所述任务获取单元包括潜力值获取子单元和搜索停止子单元，所述任务获取单元用于采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务时：

所述潜力值获取子单元，用于采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索时，获取所述训练场景下所述初始任务对应的优化潜力值；

所述搜索停止子单元，用于若所述优化潜力值小于潜力阈值，则停止对所述初始任务进行搜索。

10.根据权利要求9所述的装置，其中，所述装置还包括信息获取单元和时长分配单元，用于在所述获取所述初始任务对应的优化潜力值之后：

所述信息获取单元，用于获取与所述优化潜力值对应的时间资源信息；

所述时长分配单元，用于对所述初始任务分配与所述时间资源信息对应的搜索时长。

11.根据权利要求7所述的装置，其中，所述装置还包括信息存储单元，用于在采用所述推理时长任务调度策略、训练任务调度策略和所述训练运行方式对所述初始任务进行搜索，得到目标任务之后：

所述信息存储单元，用于获取并存储所述目标任务对应的第一目标配置信息。

12.根据权利要求7所述的装置，其中，所述装置还包括代码获取单元和代码运行单元，用于在获取与初始任务对应的任务调度策略之前：

所述代码获取单元，用于若确定缓存中存在与所述初始任务对应的第二目标配置信息，则基于所述第二目标配置信息获取硬件代码；

所述代码运行单元，用于控制硬件运行所述硬件代码，获取所述初始任务对应的运行信息。

13.一种服务器，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其特征在于，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。