CN116185629A - 一种任务执行的方法、装置、存储介质及电子设备 - Google Patents
一种任务执行的方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN116185629A CN116185629A CN202310181068.3A CN202310181068A CN116185629A CN 116185629 A CN116185629 A CN 116185629A CN 202310181068 A CN202310181068 A CN 202310181068A CN 116185629 A CN116185629 A CN 116185629A
- Authority
- CN
- China
- Prior art keywords
- task
- model
- link
- target
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5072—Grid computing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computer And Data Communications (AREA)
Abstract
本说明书公开了一种任务执行的方法、装置、存储介质及电子设备,接收任务请求,确定出用于执行任务请求对应任务的模型,作为目标模型,并将目标模型中所包含的各网络层进行拆分,以得到各子模型,根据拆分出的各子模型,将所述任务进行拆分,得到各子任务。根据执行任务请求对应任务的需求信息,确定处理各子任务时所使用的各数据传输链路,作为各目标链路,按照目标链路,将所述各子任务分配给各目标节点,以通过各目标节点,执行任务请求对应的任务。
Description
技术领域
本说明书涉及计算机技术领域,尤其涉及一种任务执行的方法、装置、存储介质及电子设备。
背景技术
随着人工智能的发展,机器学习的应用领域从广度向深度发展,这对模型训练和应用都提出了更高的要求。目前,随着模型的功能越来越强,在模型训练时,常见的一种方式是:将模型部署到云端,终端把需要处理的数据发送给服务器,服务器通过部署的模型对数据进行处理,得到处理结果。
但是,这种将处理任务全部发送给服务器来执行的方式,不仅严重占用服务器的资源,也降低了任务的处理效率。
因此,在执行任务的过程中,如何充分利用到终端设备和服务器的算力资源,将任务分配到最合适的计算节点上来执行任务,则是个亟待解决的问题。
发明内容
本说明书提供一种任务执行的方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种任务执行的方法,包括:
接收任务请求;
确定出用于执行所述任务请求对应任务的模型,作为目标模型;
将所述目标模型中包含的各网络层进行拆分,以得到各子模型,其中,每个子模型包含有所述目标模型中的部分网络层;
根据拆分出的各子模型,将所述任务进行拆分,得到各子任务;
根据执行所述任务请求对应任务的需求信息,确定处理各子任务时所使用的各数据传输链路,作为各目标链路,其中,每条目标链路中包含有目标节点,所述目标节点中部署有用于执行经该目标链路处理的子任务所需的子模型;
按照所述目标链路,将所述各子任务分配给各目标节点,以通过所述各目标节点,执行所述任务请求对应的任务。
可选地,确定出用于执行所述任务请求对应任务的模型,作为目标模型,具体包括:
根据执行所述任务请求对应任务的需求信息,确定出用于执行所述任务请求对应任务的模型,作为目标模型。
可选地,所述方法还包括:
若在执行所述任务请求对应的任务之前确定所述需求信息发生变化,则根据变化后的需求信息,重新确定出用于执行所述任务请求对应任务的模型。
可选地,所述方法还包括:
若在执行所述任务请求对应的任务之前确定出用于执行所述任务请求对应任务的模型发生更新,则将更新后的模型作为目标模型。
可选地,将所述目标模型中包含的各网络层进行拆分,以得到各子模型,具体包括:
根据所述目标模型中预先标注的可拆分网络层的标记,将所述目标模型中包含的各网络层进行拆分,以得到各子模型。
可选地,根据执行所述任务请求对应任务的需求信息,确定处理各子任务时所使用的各数据传输链路,作为各目标链路,具体包括:
根据执行所述任务请求对应任务的需求信息,确定出各候选链路;
针对每条候选链路,若该候选链路中包含有中间节点,则根据所述中间节点的节点参数以及该候选链路中部署有用于处理子任务的子模型的节点的节点参数,确定该候选链路的链路参数,其中,所述中间节点用于将通过该候选链路中执行任务所需的数据发送给在该候选链路中部署有子模型的节点;
根据每条候选链路对应的链路参数以及所述需求信息,从所述候选链路中确定出处理各子任务时所使用的各数据传输链路,作为各目标链路。
可选地,根据每条候选链路对应的链路参数以及所述需求信息,从所述候选链路中确定出处理各子任务时所使用的各数据传输链路,作为各目标链路,具体包括:
根据每条候选链路对应的链路参数以及所述需求信息,分别确定出每条候选链路对应的传输效率值;
根据每条候选链路的传输效率值,确定各目标链路。
本说明书提供了一种任务执行的装置,包括:
接收模块,用于接收任务请求;
第一确定模块,用于确定出用于执行所述任务请求对应任务的模型,作为目标模型;
第一拆分模块,用于将所述目标模型中包含的各网络层进行拆分,以得到各子模型,其中,每个子模型包含有所述目标模型中的部分网络层;
第二拆分模块,用于根据拆分出的各子模型,将所述任务进行拆分,得到各子任务;
第二确定模块,用于根据执行所述任务请求对应任务的需求信息,确定处理各子任务时所使用的各数据传输链路,作为各目标链路,其中,每条目标链路中包含有目标节点,所述目标节点中部署有用于执行经该目标链路处理的子任务所需的子模型;
分配模块,用于按照所述目标链路,将所述各子任务分配给各目标节点,以通过所述各目标节点,执行所述任务请求对应的任务。
可选地,所述第一确定模块具体用于,根据执行所述任务请求对应任务的需求信息,确定出用于执行所述任务请求对应任务的模型,作为目标模型。
可选地,所述第一确定模块还用于,若在执行所述任务请求对应的任务之前确定所述需求信息发生变化,则根据变化后的需求信息,重新确定出用于执行所述任务请求对应任务的模型。
可选地,所述第一确定模块还用于,若在执行所述任务请求对应的任务之前确定出用于执行所述任务请求对应任务的模型发生更新,则将更新后的模型作为目标模型。
可选地,所述第一拆分模块具体用于,根据所述目标模型中预先标注的可拆分网络层的标记,将所述目标模型中包含的各网络层进行拆分,以得到各子模型。
可选地,所述第二确定模块具体用于,根据执行所述任务请求对应任务的需求信息,确定出各候选链路;针对每条候选链路,若该候选链路中包含有中间节点,则根据所述中间节点的节点参数以及该候选链路中部署有用于处理子任务的子模型的节点的节点参数,确定该候选链路的链路参数,其中,所述中间节点用于将通过该候选链路中执行任务所需的数据发送给在该候选链路中部署有子模型的节点;根据每条候选链路对应的链路参数以及所述需求信息,从所述候选链路中确定出处理各子任务时所使用的各数据传输链路,作为各目标链路。
可选地,所述第二确定模块具体用于,根据每条候选链路对应的链路参数以及所述需求信息,分别确定出每条候选链路对应的传输效率值;根据每条候选链路的传输效率值,确定各目标链路。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任务执行的方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任务执行的方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
本说明书提供的任务执行的方法,接收任务请求后,确定出用于执行任务请求对应任务的模型,作为目标模型,并将目标模型中所包含的各网络层进行拆分,以得到各子模型,根据拆分出的各子模型,将任务进行拆分,得到各子任务。根据执行任务请求对应任务的需求信息,确定处理各子任务时所使用的各数据传输链路,作为各目标链路,按照目标链路,将各子任务分配给各目标节点,以通过各目标节点,执行任务请求对应的任务。
从上述方法中可以看出,本申请在执行任务时,根据执行任务请求对应任务的需求信息,先将用于执行任务的目标模型以及任务进行拆分,再将拆分后的各子模型和各子任务分别部署到各目标节点,以通过各目标节点执行任务。本申请将各子模型分配到最合适的目标节点上来执行任务,充分利用到了各计算节点的算力资源,提高了执行任务的效率。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中提供的一种任务执行的方法的流程示意图;
图2为本说明书提供的执行某一任务的部分需求信息示意图;
图3为本说明书提供的候选链路示意图;
图4为本说明书提供的一种任务执行的装置结构的示意图;
图5为本说明书提供的一种对应于图1的电子设备的结构示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中提供的一种任务执行的方法的流程示意图,包括以下步骤:
S100:接收任务请求。
S102:确定出用于执行所述任务请求对应任务的模型,作为目标模型。
本申请的执行主体可以是服务器,也可以是诸如平板电脑,笔记本电脑,台式电脑等电子设备。为了便于说明,下面仅以服务器为执行主体,对本申请提供的任务执行的方法进行说明。
服务器在接收到终端设备发送的任务请求后,可以获取任务请求中执行任务的需求信息,再根据执行任务请求对应任务的需求信息,确定出用于执行任务的模型,作为目标模型。
例如,针对对目标对象进行面部识别这一任务,服务器在接收到该任务的任务请求后,可以获取任务请求中执行任务的需求信息,如执行任务请求的模型准确度、以及模型参数量或者参数精度等等。根据执行任务请求对应任务的需求信息,服务器可以按照需求信息,从模型池中确定出满足用于执行面部识别任务需求的模型,作为目标模型。其中,模型准确度用于表示模型输出结果的准确度,参数精度用于表示模型参数的精度,如32位或8位。
在本说明书中,目标模型可以是经过模型压缩后的小模型,也可以是经过参数聚合后的更新模型,本说明书不对目标模型的形式进行限制。
进一步地,在确定出满足任务需求信息的目标模型后,服务器可以根据本地终端设备的剩余存储空间,判断目标模型是否能够部署到终端设备,若剩余存储空间足够目标模型部署到终端设备上,则服务器可以将目标模型发送到本地的终端设备,后续可以通过部署了目标模型的终端设备来执行任务。若目标模型不能部署到终端设备,后续服务器可以将目标模型进行拆分,将拆分后的目标模型分别发送到各个计算节点,以通过各计算节点来执行任务。其中,计算节点包含终端设备。
需要说明的是,在服务器将目标模型发送到终端设备后,若在执行任务请求对应的任务之前任务的需求信息发生变化,比如执行任务请求的参数精度发生变化,或执行任务时所处的业务环境、无线通信环境发生改变等等,此时,服务器可以根据变化后的需求信息,重新确定出用于执行任务请求对应任务的模型。进一步地,服务器重新将确定的目标模型发送给终端设备时,模型分发的时间间隔应超过预设的最小更新间隔。
例如,在执行对目标对象进行面部识的任务时,针对目标图像,若目标图像从白天变成了夜晚,服务器需要重新确定出用于在夜间进行面部识别的模型,作为用于执行任务的目标模型。并且,假设模型分发的最小更新间隔为2s,在白天时服务器已经下发了用于在白天进行面部识别的模型A,此时业务环境发生了变化,服务器需要将重新确定出的用于在夜间进行面部识别的模型B发送到终端,服务器可以在最小更新间隔即2s后发送模型B。
同样地,若在执行任务请求对应的任务之前确定出用于执行任务的模型发生更新,服务器可以将更新后的模型作为目标模型,再根据本地终端设备的剩余存储空间,判断目标模型是否能够部署到终端设备。
S104:将所述目标模型中包含的各网络层进行拆分,以得到各子模型,其中,每个子模型包含有所述目标模型中的部分网络层。
在确定出用于执行任务请求对应任务的目标模型后,为了充分利用各计算节点的算力资源,提高执行任务的效率,服务器可以将目标模型中所包含的各网络层进行拆分,以得到各子模型,后续服务器可以将各子模型部署到各计算节点上来执行任务。其中,每个子模型包含有所述目标模型中的部分网络层,计算节点包括终端设备或者远端计算设备,如服务器。
具体地,服务器可以根据目标模型中预先标注的可拆分网络层的标记,将目标模型中所包含的各网络层进行拆分,以得到各子模型。例如,假设目标模型有二十个网络层,若目标模型的第五个网络层中含有预先标注的可拆分网络层的标记,服务器可以根据该标记,将目标模型拆分成两个子模型,其中一个子模型中包含有目标模型中的前五个网络层,另一个子模型包含有目标模型中的后十五个网络层。
服务器可以将包含目标模型中前五个网络层的子模型部署到本地终端设备,将包含有目标模型中的后十五个网络层的子模型部署到邻近终端设备或远端计算设备。并且,服务器可以获取各子模型对应的输出数据的大小和计算量,如各子模型中包含的参数量。
S106:根据拆分出的各子模型,将所述任务进行拆分,得到各子任务。
在将目标模型拆分得到各子模型后,服务器可以根据拆分出的各子模型,将任务进行拆分,得到各子任务。
例如,针对对目标对象进行面部识别这一任务,假设服务器将目标模型拆分成了两个子模型,那么,服务器可以根据拆分出的子模型,将任务拆分成两个子任务。具体地,服务器可以将该任务拆分成一个子任务:从目标图像中确定出目标对象,以及另一个子任务:对确定出的目标对象进行面部识别,以做进一步地确认。后续服务器可以将各子模型和各子任务分别发送到各目标节点上,以通过各目标节点执行任务,从而提高执行任务的效率。
S108:根据执行所述任务请求对应任务的需求信息,确定处理各子任务时所使用的各数据传输链路,作为各目标链路,其中,每条目标链路中包含有目标节点,所述目标节点中部署有用于执行经该目标链路处理的子任务所需的子模型。
服务器在得到拆分后的各子任务后,在将各子模型以及各子任务发送到各计算节点上执行任务时,服务器可以根据执行任务的需求信息,确定出各候选链路。
具体地,服务器可以根据执行任务的需求信息,获取执行任务的算力需求,如算力、存储吞吐量以及能耗等等,以及获取执行任务的网络需求,如时延、带宽以及传输吞吐量等等。
为了便于理解,图2为本说明书提供的执行某一任务的部分需求信息(即算网需求)。其中,针对不同类型的需求,服务器预先设置了不同的标识。如图2所示,执行该任务需要2TFLOPS的算力,以及200us的时延,若执行该任务的算力需求大于时延需求,则算力的权重大于时延的权重。
服务器可以获取已有的传输链路的算力资源和网络资源(即算网资源),从已有的传输链路中确定出满足执行任务的算网需求的各传输链路,作为各候选链路,其中,每条候选链路中都部署有用于处理子任务的子模型的计算节点。
针对每条候选链路,若该候选链路中包含有中间节点,服务器可以根据中间节点的节点参数以及该候选链路中部署有用于处理子任务的子模型的计算节点的节点参数,确定该候选链路的链路参数。其中,中间节点用于将通过该候选链路中执行任务所需的数据发送给在该候选链路中部署有子模型的节点。
图3为本说明书提供的候选链路示意图,若该候选链路中包含有中间节点,比如基站、路由器以及交换机等网络设备,服务器可以根据该候选链路中包含的网络设备的参数,以及计算节点的参数,确定该候选链路的链路参数。
值得说明的是,执行任务时需要使用到的计算节点的数量与子模型的数量可以是相同的。继续沿用上例,在执行对目标对象进行面部识别这一任务时,服务器将目标模型拆分成两个子模型,并将任务拆分成两个子任务,后续服务器可以分别将两个子模型部署到两个计算节点中,分别通过这两个计算节点来执行任务。并且,在执行任务的过程中,两个计算节点的执行顺序取决于两个子任务的执行顺序,计算节点在执行完从目标图像中确定出目标对象这个子任务后,可以将输出的中间数据通过候选链路发送到另一个计算节点,使其完成对确定出的目标对象进行面部识别的子任务。
针对不同的候选链路,每条候选链路中包含的中间节点或部署有子模型的计算节点,是不完全相同的。例如,不同候选链路中包含的计算节点可能是相同的,但候选链路中包含的中间节点不同;或者,候选链路中包含的中间节点相同,但是候选链路中包含的计算节点不同。需要说明的是,中间节点可以是部署有子模型的两个计算节点之间的节点,用于将一个计算节点的输出数据转发给另一个计算节点,也可以是部署在终端设备和计算节点之间的节点。
进一步地,服务器可以根据每条候选链路对应的链路参数以及所述需求信息,分别确定出每条候选链路对应的传输效率值,再根据每条候选链路的传输效率值,确定各目标链路,并将各目标链路中的各计算节点作为各目标节点。
服务器在确定每条候选链路对应的传输效率值时,可采用公式:
其中,ai表示第i个算网需求的指标值,ti表示第i个算网需求的标识,表示第s条传输路径的第i个算网资源的指标值,wi表示算网需求的权重值,该值缺失时默认为1。例如,假设算网需求共有M个,包括算力、时延、距离等等,当第i个算网需求为时延时,ai表示时延的指标值为200us,ti表示时延对应的标识为1。
S110:按照所述目标链路,将所述各子任务分配给各目标节点,以通过所述各目标节点,执行所述任务请求对应的任务。
通过上述公式,服务器可以根据每条候选链路对应的链路参数以及需求信息,确定每条候选链路对应的传输效率值。进一步地,服务器可以将处理各子任务时所使用的传输效率值最大的各候选链路,作为各目标链路。
其中,传输效率值用于表征通过该链路来执行任务的任务综合执行情况,传输效率值越高,表示任务执行情况越好,比如在该候选链路上的计算节点处理速度更快,存储吞吐量更高等等。
服务器在确定出各目标链路后,可以按照目标链路,将各子任务分配给各目标节点,以通过各目标节点,执行任务请求对应的任务。
从上述方法中可以看出,本申请在执行任务时,根据执行任务请求对应任务的需求信息,先将用于执行任务的目标模型以及任务进行拆分,再将拆分后的各子模型和各子任务分别部署到各目标节点,各目标节点可以包含其他的计算节点,也可以包含本地的终端设备。本申请在将拆分后的各子模型部署到各目标节点时,可以将各子模型部署到除终端设备以外的其他计算节点上,也可以将部分子模型部署到终端设备上,另一部分子模型部署到其他计算节点上,这样不仅充分利用到了各目标节点的算力资源,另一方面,也使得本地的终端设备能够协同其他的计算节点执行任务,进一步提高了执行任务的效率。
以上为本说明书的一个或多个实施的方法,基于同样的思路,本说明书还提供了相应的任务执行的装置,如图4所示。
图4为本说明书提供的一种的任务执行的装置的示意图,包括:
接收模块400,用于接收任务请求;
第一确定模块402,用于确定出用于执行所述任务请求对应任务的模型,作为目标模型;
第一拆分模块404,用于将所述目标模型中包含的各网络层进行拆分,以得到各子模型,其中,每个子模型包含有所述目标模型中的部分网络层;
第二拆分模块406,用于根据拆分出的各子模型,将所述任务进行拆分,得到各子任务;
第二确定模块408,用于根据执行所述任务请求对应任务的需求信息,确定处理各子任务时所使用的各数据传输链路,作为各目标链路,其中,每条目标链路中包含有目标节点,所述目标节点中部署有用于执行经该目标链路处理的子任务所需的子模型;
分配模块410,用于按照所述目标链路,将所述各子任务分配给各目标节点,以通过所述各目标节点,执行所述任务请求对应的任务。
可选地,所述第一确定模块402具体用于,根据执行所述任务请求对应任务的需求信息,确定出用于执行所述任务请求对应任务的模型,作为目标模型。
可选地,所述第一确定模块402还用于,若在执行所述任务请求对应的任务之前确定所述需求信息发生变化,则根据变化后的需求信息,重新确定出用于执行所述任务请求对应任务的模型。
可选地,所述第一确定模块402还用于,若在执行所述任务请求对应的任务之前确定出用于执行所述任务请求对应任务的模型发生更新,则将更新后的模型作为目标模型。
可选地,所述第一拆分模块404具体用于,根据所述目标模型中预先标注的可拆分网络层的标记,将所述目标模型中包含的各网络层进行拆分,以得到各子模型。
可选地,所述第二确定模块408具体用于,根据执行所述任务请求对应任务的需求信息,确定出各候选链路;针对每条候选链路,若该候选链路中包含有中间节点,则根据所述中间节点的节点参数以及该候选链路中部署有用于处理子任务的子模型的节点的节点参数,确定该候选链路的链路参数,其中,所述中间节点用于将通过该候选链路中执行任务所需的数据发送给在该候选链路中部署有子模型的节点;根据每条候选链路对应的链路参数以及所述需求信息,从所述候选链路中确定出处理各子任务时所使用的各数据传输链路,作为各目标链路。
可选地,所述第二确定模块408具体用于,根据每条候选链路对应的链路参数以及所述需求信息,分别确定出每条候选链路对应的传输效率值;根据每条候选链路的传输效率值,确定各目标链路。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1提供的一种任务执行的方法。
本说明书还提供了图5所示的一种对应于图1的电子设备的示意结构图。如图5所示,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的任务执行的方法。
当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (16)
1.一种任务执行的方法,其特征在于,包括:
接收任务请求;
确定出用于执行所述任务请求对应任务的模型,作为目标模型;
将所述目标模型中包含的各网络层进行拆分,以得到各子模型,其中,每个子模型包含有所述目标模型中的部分网络层;
根据拆分出的各子模型,将所述任务进行拆分,得到各子任务;
根据执行所述任务请求对应任务的需求信息,确定处理各子任务时所使用的各数据传输链路,作为各目标链路,其中,每条目标链路中包含有目标节点,所述目标节点中部署有用于执行经该目标链路处理的子任务所需的子模型;
按照所述目标链路,将所述各子任务分配给各目标节点,以通过所述各目标节点,执行所述任务请求对应的任务。
2.如权利要求1所述的方法,其特征在于,确定出用于执行所述任务请求对应任务的模型,作为目标模型,具体包括:
根据执行所述任务请求对应任务的需求信息,确定出用于执行所述任务请求对应任务的模型,作为目标模型。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
若在执行所述任务请求对应的任务之前确定所述需求信息发生变化,则根据变化后的需求信息,重新确定出用于执行所述任务请求对应任务的模型。
4.如权利要求2所述的方法,其特征在于,所述方法还包括:
若在执行所述任务请求对应的任务之前确定出用于执行所述任务请求对应任务的模型发生更新,则将更新后的模型作为目标模型。
5.如权利要求1所述的方法,其特征在于,将所述目标模型中包含的各网络层进行拆分,以得到各子模型,具体包括:
根据所述目标模型中预先标注的可拆分网络层的标记,将所述目标模型中包含的各网络层进行拆分,以得到各子模型。
6.如权利要求1所述的方法,其特征在于,根据执行所述任务请求对应任务的需求信息,确定处理各子任务时所使用的各数据传输链路,作为各目标链路,具体包括:
根据执行所述任务请求对应任务的需求信息,确定出各候选链路;
针对每条候选链路,若该候选链路中包含有中间节点,则根据所述中间节点的节点参数以及该候选链路中部署有用于处理子任务的子模型的节点的节点参数,确定该候选链路的链路参数,其中,所述中间节点用于将通过该候选链路中执行任务所需的数据发送给在该候选链路中部署有子模型的节点;
根据每条候选链路对应的链路参数以及所述需求信息,从所述候选链路中确定出处理各子任务时所使用的各数据传输链路,作为各目标链路。
7.如权利要求6所述的方法,其特征在于,根据每条候选链路对应的链路参数以及所述需求信息,从所述候选链路中确定出处理各子任务时所使用的各数据传输链路,作为各目标链路,具体包括:
根据每条候选链路对应的链路参数以及所述需求信息,分别确定出每条候选链路对应的传输效率值;
根据每条候选链路的传输效率值,确定各目标链路。
8.一种任务执行的装置,其特征在于,包括:
接收模块,用于接收任务请求;
第一确定模块,用于确定出用于执行所述任务请求对应任务的模型,作为目标模型;
第一拆分模块,用于将所述目标模型中包含的各网络层进行拆分,以得到各子模型,其中,每个子模型包含有所述目标模型中的部分网络层;
第二拆分模块,用于根据拆分出的各子模型,将所述任务进行拆分,得到各子任务;
第二确定模块,用于根据执行所述任务请求对应任务的需求信息,确定处理各子任务时所使用的各数据传输链路,作为各目标链路,其中,每条目标链路中包含有目标节点,所述目标节点中部署有用于执行经该目标链路处理的子任务所需的子模型;
分配模块,用于按照所述目标链路,将所述各子任务分配给各目标节点,以通过所述各目标节点,执行所述任务请求对应的任务。
9.如权利要求8所述的装置,其特征在于,所述第一确定模块具体用于,根据执行所述任务请求对应任务的需求信息,确定出用于执行所述任务请求对应任务的模型,作为目标模型。
10.如权利要求9所述的装置,其特征在于,所述第一确定模块还用于,若在执行所述任务请求对应的任务之前确定所述需求信息发生变化,则根据变化后的需求信息,重新确定出用于执行所述任务请求对应任务的模型。
11.如权利要求9所述的装置,其特征在于,所述第一确定模块还用于,若在执行所述任务请求对应的任务之前确定出用于执行所述任务请求对应任务的模型发生更新,则将更新后的模型作为目标模型。
12.如权利要求8所述的装置,其特征在于,所述第一拆分模块具体用于,根据所述目标模型中预先标注的可拆分网络层的标记,将所述目标模型中包含的各网络层进行拆分,以得到各子模型。
13.如权利要求12所述的装置,其特征在于,所述第二确定模块具体用于,根据执行所述任务请求对应任务的需求信息,确定出各候选链路;针对每条候选链路,若该候选链路中包含有中间节点,则根据所述中间节点的节点参数以及该候选链路中部署有用于处理子任务的子模型的节点的节点参数,确定该候选链路的链路参数,其中,所述中间节点用于将通过该候选链路中执行任务所需的数据发送给在该候选链路中部署有子模型的节点;根据每条候选链路对应的链路参数以及所述需求信息,从所述候选链路中确定出处理各子任务时所使用的各数据传输链路,作为各目标链路。
14.如权利要求13所述的装置,其特征在于,所述第二确定模块具体用于,根据每条候选链路对应的链路参数以及所述需求信息,分别确定出每条候选链路对应的传输效率值;根据每条候选链路的传输效率值,确定各目标链路。
15.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
16.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310181068.3A CN116185629A (zh) | 2023-02-22 | 2023-02-22 | 一种任务执行的方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310181068.3A CN116185629A (zh) | 2023-02-22 | 2023-02-22 | 一种任务执行的方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116185629A true CN116185629A (zh) | 2023-05-30 |
Family
ID=86436335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310181068.3A Pending CN116185629A (zh) | 2023-02-22 | 2023-02-22 | 一种任务执行的方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116185629A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116467061A (zh) * | 2023-06-19 | 2023-07-21 | 之江实验室 | 一种任务执行的方法、装置、存储介质及电子设备 |
CN116880995A (zh) * | 2023-09-08 | 2023-10-13 | 之江实验室 | 一种模型任务的执行方法、装置、存储介质及电子设备 |
CN117724823A (zh) * | 2024-02-07 | 2024-03-19 | 之江实验室 | 基于声明式语义的多模型工作流描述的任务执行方法 |
US12039361B1 (en) | 2023-06-19 | 2024-07-16 | Zhejiang Lab | Methods and apparatuses for executing tasks, storage mediums, and electronic devices |
-
2023
- 2023-02-22 CN CN202310181068.3A patent/CN116185629A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116467061A (zh) * | 2023-06-19 | 2023-07-21 | 之江实验室 | 一种任务执行的方法、装置、存储介质及电子设备 |
CN116467061B (zh) * | 2023-06-19 | 2023-09-19 | 之江实验室 | 一种任务执行的方法、装置、存储介质及电子设备 |
US12039361B1 (en) | 2023-06-19 | 2024-07-16 | Zhejiang Lab | Methods and apparatuses for executing tasks, storage mediums, and electronic devices |
CN116880995A (zh) * | 2023-09-08 | 2023-10-13 | 之江实验室 | 一种模型任务的执行方法、装置、存储介质及电子设备 |
CN116880995B (zh) * | 2023-09-08 | 2024-01-09 | 之江实验室 | 一种模型任务的执行方法、装置、存储介质及电子设备 |
CN117724823A (zh) * | 2024-02-07 | 2024-03-19 | 之江实验室 | 基于声明式语义的多模型工作流描述的任务执行方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116185629A (zh) | 一种任务执行的方法、装置、存储介质及电子设备 | |
CN111756550B (zh) | 一种区块链共识方法及装置 | |
CN109002357B (zh) | 资源分配方法、装置及物联网系统 | |
CN110401700A (zh) | 模型加载方法及系统、控制节点及执行节点 | |
CN117195997B (zh) | 一种模型训练方法、装置、存储介质及电子设备 | |
CN111782409B (zh) | 任务处理、风险识别任务处理方法、装置及电子设备 | |
CN114780225A (zh) | 一种分布式模型训练系统、方法及装置 | |
CN116467061B (zh) | 一种任务执行的方法、装置、存储介质及电子设备 | |
CN116225669B (zh) | 一种任务执行方法、装置、存储介质及电子设备 | |
CN110955720A (zh) | 一种数据加载方法、装置及系统 | |
CN116932175B (zh) | 一种基于序列生成的异构芯片任务调度方法以及装置 | |
CN111400032B (zh) | 一种资源分配的方法及装置 | |
CN115964181B (zh) | 一种数据处理的方法、装置、存储介质及电子设备 | |
CN116107728B (zh) | 一种任务执行方法、装置、存储介质及电子设备 | |
CN117093862A (zh) | 一种模型训练的方法、装置、电子设备及存储介质 | |
CN116089046A (zh) | 基于软件定义算力网络的调度方法、装置、设备及介质 | |
CN116737345A (zh) | 分布式任务处理系统及方法、装置、存储介质以及设备 | |
CN116304212A (zh) | 一种数据处理系统、方法、设备及存储介质 | |
CN116384505A (zh) | 一种数据处理的方法、装置、存储介质及电子设备 | |
CN113887773A (zh) | 一种订单调度方法、装置、存储介质及电子设备 | |
CN116095083B (zh) | 一种计算方法、系统、装置、存储介质及电子设备 | |
CN109614388A (zh) | 一种预算扣减方法和装置 | |
CN117010485B (zh) | 边缘场景下的分布式模型训练系统及梯度规约方法 | |
CN117201334B (zh) | 一种多模态网络流量预测方法及装置 | |
CN117421129B (zh) | 一种基于异构存储集群的业务执行方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |