CN112506619A - 作业处理方法、装置、电子设备、存储介质和程序产品 - Google Patents

作业处理方法、装置、电子设备、存储介质和程序产品 Download PDF

Info

Publication number
CN112506619A
CN112506619A CN202011509353.6A CN202011509353A CN112506619A CN 112506619 A CN112506619 A CN 112506619A CN 202011509353 A CN202011509353 A CN 202011509353A CN 112506619 A CN112506619 A CN 112506619A
Authority
CN
China
Prior art keywords
target
job
resource space
server cluster
subtasks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011509353.6A
Other languages
English (en)
Other versions
CN112506619B (zh
Inventor
曹璨
杨咏臻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202011509353.6A priority Critical patent/CN112506619B/zh
Publication of CN112506619A publication Critical patent/CN112506619A/zh
Application granted granted Critical
Publication of CN112506619B publication Critical patent/CN112506619B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45562Creating, deleting, cloning virtual machine instances
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/45595Network integration; Enabling network access in virtual machine instances
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本公开公开了一种作业处理方法、装置、电子设备、存储介质和计算器程序产品,涉及人工智能领域,具体涉及计算机视觉方面。具体实现方案为:在接收到目标作业的部署请求的情况下,响应于所述部署请求,检测所述目标作业所需资源空间的大小;基于所述目标作业所需资源空间的大小,在目标服务器集群中确定目标资源空间,其中,所述目标资源空间的大小与所述目标作业所需资源空间的大小相适配;将所述目标作业部署于所述目标服务器集群,以使所述目标服务器集群基于所述目标资源空间处理所述目标作业的作业任务。本公开提供一种作业处理方法、装置、电子设备和程序产品,可以解决现有技术中对作业任务进行部署的效果较差的问题。

Description

作业处理方法、装置、电子设备、存储介质和程序产品
技术领域
本公开涉及人工智能领域,具体涉及中的计算机视觉技术领域方面,具体涉及一种作业处理方法、装置、电子设备和程序产品。
背景技术
现有技术中,服务平台所处理的作业任务通常是由人工进行部署,具体而言,当部署人员接收到部署任务时,根据业务方提出的资源数量需求,在服务器集群中为所述作业任务划分对应的资源空间,并将所述作业任务部署于服务器集群,以便于服务器集群基于所划分的资源空间处理所述作业任务。
发明内容
本公开提供一种作业处理方法、装置、电子设备和程序产品,可以解决现有技术中对作业任务进行部署的效果较差的问题。
根据本公开的第一方面,本公开提供一种作业处理方法,包括:
在接收到目标作业的部署请求的情况下,响应于所述部署请求,检测所述目标作业所需资源空间的大小;
基于所述目标作业所需资源空间的大小,在目标服务器集群中确定目标资源空间,其中,所述目标资源空间的大小与所述目标作业所需资源空间的大小相适配;
将所述目标作业部署于所述目标服务器集群,以使所述目标服务器集群基于所述目标资源空间处理所述目标作业的作业任务。
根据本公开的另一方面,提供了一种作业处理装置,包括:
检测模块,用于在接收到目标作业的部署请求的情况下,响应于所述部署请求,检测所述目标作业所需资源空间的大小;
确定模块,用于基于所述目标作业所需资源空间的大小,在目标服务器集群中确定目标资源空间,其中,所述目标资源空间的大小与所述目标作业所需资源空间的大小相适配;
部署模块,用于将所述目标作业部署于所述目标服务器集群,以使所述目标服务器集群基于所述目标资源空间处理所述目标作业的作业任务。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开提供的作业处理方法步骤。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本公开提供的作业处理方法步骤。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开提供的作业处理方法步骤。
根据本公开的技术方案,在接收到目标作业的部署任务的情况下,自动检测目标作业所需资源空间的大小,并在目标服务器集群中确定目标资源空间,然后,将部署任务部署于目标服务器集群,以使所述目标服务器集群基于所述目标资源空间处理目标作业。相对于现有技术中采用人工进行部署的方式而言,可以提高部署的效率,同时,可以提高资源的利用率,从而提高了对作业任务进行部署的效果。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开实施例中所提供的作业处理方法的流程图;
图2是本公开实施例中所提供的作业处理系统的模块图;
图3是本公开实施例中所提供的作业处理装置的结构示意图之一;
图4是本公开实施例中所提供的作业处理装置的结构示意图之二;
图5是本公开实施例中部署模块的结构示意图;
图6是用来实现本公开实施例的作业处理方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
请参见图1,图1是本公开实施例提供的一种作业处理方法,包括:
步骤S101、在接收到目标作业的部署请求的情况下,响应于所述部署请求,检测所述目标作业所需资源空间的大小。
上述作业处理方法可以应用于电子设备,具体而言,可以在电子设备中构建作业提交系统,所述作业提交系统可以用于对接业务端与目标服务器集群。具体而言,业务端可以将目标作业的部署请求发送至所述作业提交系统,作业提交系统可以响应于所述部署请求,在所述目标服务器集群上部署所述目标作业。
其中,上述目标作业可以是业务端向服务平台提交的各类作业请求,具体而言,所述目标作业可以是视觉智能计算类的作业请求。例如,所述目标作业可以是业务端所提交的对多媒体数据进行审核或分类等作业的请求。
上述目标作业的部署请求可以包括测试包,所述测试包可以包括业务端在过去一段时间内的历史数据,可以通过对业务端的历史数据进行检测,以确定后续目标服务器集群处理所述业务端的业务时,所需投入的物理资源的数量。例如,所述业务端可以是短视频平台,所述短视频平台每天都会接收到平台用户上传的大量的视频数据,短视频平台在发布用户的视频数据之前,通常需要对用户上传的视频数据进行审核以及分类等工作。当所述目标作业为对短视频平台的视频数据进行审核和分类的作业时,可以将短视频平台在过去一段时间内所接收到的所有视频数据作业测试包发送至作业提交系统,此时,作业提交系统可以对所述测试包进行压测,以确定后续目标服务器集群处理所述业务端的业务时,所需投入的物理资源的数量。其中,所述测试包可以是从短视频平台过去一段时间内的历史视频数据中随机抽样得到的数据包。
上述目标作业所需资源空间的大小即后续目标服务器集群处理所述业务端的业务时,所需投入的物理资源的数量。
上述资源空间中的资源可以包括中央处理器(CPU,Central Processing Unit)、图形处理器(英语:Graphics Processing Unit,缩写:GPU)、内存磁盘等物理资源。
其中,在服务平台发起算子调用申请,审批通过及完成部署后,正式开始运行的算子调用任务称为作业。申请作业接入时可以同时选择多个算子,实际运行和监控时一个独立算子调用记为一个独立作业。
步骤S102、基于所述目标作业所需资源空间的大小,在目标服务器集群中确定目标资源空间,其中,所述目标资源空间的大小与所述目标作业所需资源空间的大小相适配。
上述目标资源空间的大小与所述目标作业所需资源空间的大小相适配可以是指目标资源空间的大小与所述目标作业所需资源空间的大小相同,当然,也可以是指目标资源空间的大小大于所述目标作业所需资源空间的大小。
步骤S103、将所述目标作业部署于所述目标服务器集群,以使所述目标服务器集群基于所述目标资源空间处理所述目标作业的作业任务。
具体而言,在处理目标作业所需的资源空间的大小之后,从所述目标服务器集群中划分出所述目标资源空间作为处理所述目标作业的作业空间,同时,可以所述处理所述目标作业的作业算子,并将作业算子接入所述目标服务器集群,从而完成对所述目标作业的部署过程。
上述作业算子可以是指:单个或多个音视频及相关图像等的模型/能力的服务化、规范化封装,符合平台统一的算子标准,可在视频中台部署/运行并提供调用/下载。
该实施方式中,在接收到目标作业的部署任务的情况下,自动检测目标作业所需资源空间的大小,并在目标服务器集群中确定目标资源空间,然后,将部署任务部署于目标服务器集群,从而实现了目标作业的自动部署,相对于现有技术采用人工部署的方式而言,可以有效的提高部署的效率。此外,在对目标作业进行部署之前,通过对目标作业所需资源空间的大小进行检测,并基于检测结果在所述目标服务器集群中确定与所述目标作业所需资源空间的大小相适配的目标资源空间,以使所述目标服务器集群基于所述目标资源空间处理所述目标作业的作业任务。相对于现有技术中,仅依据业务方提出的资源数量的需求而言,本公开实施例可以相对精准的为目标作业划分资源空间,有利于比较资源的浪费,提高目标服务器集群的资源利用率。
可选地,所述作业任务包括在线子任务,所述将所述目标作业部署于所述目标服务器集群之后,所述方法还包括:
基于所述目标服务器集群在预设时间段内接收到的在线子任务的数量,预测下一时间节点的在线子任务的数量;
基于所述下一时间节点的在线子任务的数量,对所述目标资源空间的大小进行调节。
上述在线子任务可以是指业务端提交的对时效性和准确性要求较高的任务,例如,可以是在业务端提交在线子任务之后,需要在1分钟内完成审核或分类的任务。
上述在线子任务可以是指:需要对业务的输入数据进行实时反馈的服务,对服务的准确率和延时比较敏感,会关系到整个业务系统的实时响应效率和用户体验,是一种持续的服务。根据业务情况,业务流量会有波峰和波谷的形态,一般情况下,在高峰期如晚上6-10点会出现波峰,凌晨2-5点会出现波谷。
由于所述在线子任务对时效性要求较高,因此,目标服务器集群需要确保有足够的资源空间处理所述在线子任务。而目标服务器集群通常是同时为多个业务端提供作业处理服务,且目标服务器集群中的资源空间的大小通常是固定的,因此,为了提高对各个业务端的服务效果,可以根据各个业务端当前在线任务的多少,对业务端的目标资源空间进行扩缩容。
上述预设时间段内接收到的在线子任务的数量,可以是过去一段时间内的所接收到的在线子任务的数量,具体而言,上述预设时间段可以是过去1个月、过去半年或过去一年等相对较长的时间段。上述在线子任务中记录了任务类型、所接收到任务的时间、实际处理耗费的资源数量、处理该在线子任务所耗费的时间等信息。这样,可以通过将所述预设时间段内接收到的在线子任务输入学习模型,学习模型可以学习到业务端在不同时间段发送的在线子任务的规律。进而可以基于当前的在线子任务数量以及当前时间点,对下一时间节点的在线子任务的数量进行预测。
上述时间节点可以是预设的时间间隔,具体而言,所述预设的时间间隔可以是1秒钟、1分钟、10分钟等时间间隔。例如,当所述预设时间为1秒钟时,所述下一时间节点为当前时间点的下一秒,当所述预设时间节点为10分钟时,所述下一时间节点为当前时间点之后的10分钟。
该实施方式中,通过对下一时间节点目标作业的在线子任务的数量进行预测,并基于预测结果对目标资源空间的大小进行调节,这样,相对于现有技术中,无法对在线子任务的高峰时期和低谷时期对目标资源空间的大小进行适应性的调整而言,本实施例所提供的方法既可以确保目标服务器集群能够有足够的资源空间处理目标作业的在线子任务,同时,还可以避免目标资源空间由于存在闲置的资源空间,而导致资源空间浪费的问题。
可选地,所述基于所述下一时间节点的在线子任务的数量,对所述目标资源空间的大小进行调节,包括:
在所述下一时间节点的在线子任务的数量小于第一预设值的情况下,减小所述目标资源空间的大小;
在所述下一时间节点的在线子任务的数量大于第二预设值的情况下,增大所述目标资源空间的大小。
具体地,可以统计一段时间内,在线子任务随时间分布的情况,确定每个时刻在线子任务的数量所属区间,并可将所确定的区间的最大值确定为在线子任务的峰值X。上述第一预设值相对于所述X而言,可以是一个较小的值,例如,所述第一预设值可以是0.1X,这样,当预测结果指示下一时间节点的在线子任务的数量小于所述第一预设值时,则可确定下一时间节点为在线子任务的低谷时期,此时,可以减小所述目标资源空间的大小,并可将所减小的目标资源空间应用于处理其他业务端的作业任务,以提高资源空间的利用率。相应地,上述第二预设值可以是接近所述X的值,例如,所述第二预设值可以是0.9X,这样,当预测结果指示下一时间节点为在线子任务的高峰期时,若由于之前减小而目标资源空间的大小,而导致当前目标资源空间的大小不足以为所述目标作业在高峰期提供作业处理服务,则此时,可以增大所述目标资源空间的大小,以确保能够正常为服务端提供作业处理服务。
应当说明的是,上述对目标资源空间进行缩容的过程中,不删除其部署的模型、环境等配置信息,即半缩容,以便于后续对目标资源空间进行扩容时,无需重新进行配置,从而实现秒级快速扩容。
该实施方式中,在预测结果指示下一时间节点为在线子任务低谷期时,减小目标资源空间的大小,而在预测结果指示下一时间节点为在线子任务高峰期时,增大目标资源空间的大小,这样,既可以确保目标服务器集群能够有足够的资源空间处理目标作业的在线子任务,同时,还可以避免目标资源空间由于存在闲置的资源空间,而导致资源空间浪费的问题。
可选地,所述作业任务还包括离线子任务,所述基于所述目标服务器集群在预设时间段内接收到的在线子任务的数量,预测下一时间节点的在线子任务的数量之后,所述方法还包括:
在所述下一时间节点的在线子任务的数量小于所述第一预设值的情况下,将所接收到的离线子任务发送至所述目标服务器集群,以使所述目标服务器集群处理所述离线子任务。
上述离线子任务可以是时效性要求较低的任务,由于离线子任务无需及时处理,因此,在接收到离线子任务时,可以将离线子任务进行缓存,并在在线子任务的低谷时期发送至目标服务器集群,即在所述下一时间节点的在线子任务的数量小于所述第一预设值的情况下,将所接收到的离线子任务发送至所述目标服务器集群,以使所述目标服务器集群处理所述离线子任务。这样,离线子任务不会再高峰时期占用资源空间,同时,通过在低谷时期将离线子任务发送至目标服务器集群,这样,可以避免低谷时期闲置的资源空间过多。
上述离线子任务可以是指:业务会累计一定量的数据在某一个时刻提交进行批处理的任务,其对服务的吞吐要求比较大,但对服务的准确率和延时不敏感,可以接受一定程度的重试以提升准确率。该类型服务为批处理服务,即每隔一段时间会使用一次(如几天或者几个月),每次会进行大批量的数据处理。
该实施方式中,通过在所述下一时间节点的在线子任务的数量小于所述第一预设值的情况下,将所接收到的离线子任务发送至所述目标服务器集群,以使所述目标服务器集群处理所述离线子任务。这样,可以进一步提高资源空间的利用率。
可选地,所述目标服务器集群包括至少两个目标服务器,所述将所述目标作业部署于所述目标服务器集群之后,所述方法还包括:
在接收所述目标作业的第一作业任务的情况下,获取所述至少两个目标服务器中每个目标服务器的图形处理器利用率;
将所述第一作业任务发送至所述至少两个目标服务器中的第一目标服务器,其中,所述第一目标服务器为所述至少两个目标服务器中图形处理器利用率较低的目标服务器。
上述第一作业任务既可以是在线子任务,也可以是离线子任务。
具体地,由于目标服务器集群可能同时为多个业务端提供服务,因此,可以采用单卡多模型混合部署的方式将多个业务端的作业任务部署于目标服务器集群,例如,可以利用MPS(Multi Process Service)技术,使多个作业端共享同一目标服务器的GPU,这样,在接收到目标作业的作业任务时,可以对目标服务器集群中的各个目标服务器的图形处理器利用率进行检测,将所述第一作业任务发送至所述至少两个目标服务器中,图形处理器利用率较低的目标服务器。这样,可以提高各个目标服务器的图形处理器利用率。
该实施方式中,通过将所接收到的作业任务发送至所述至少两个目标服务器中,图形处理器利用率较低的目标服务器,以进一步提高图形处理器利用率。
可选地,所述将所述目标作业部署于所述目标服务器集群,包括:
获取目标算子,其中,所述目标算子用于处理所述目标作业的作业任务;
检测所述目标算子处理所述目标作业的作业任务时,对所述目标服务器集群中的图像处理器的利用率;
在所述目标算子对所述图形处理器的利用率大于第三预设值的情况下,将所述目标算子接入所述目标服务器集群。
上述第三预设值可以是一个相对较大的比值,例如,可以是50%、70%等。
上述目标算子可以是基于所述目标作业从算子库中查询到的算子,也可以是相关技术人员针对所述目标作业进行编写的算子。在将所述目标算子接入目标服务器集群之前,可以对所述目标算子进行压测,以确定目标算子CPU标准核数、MEM使用量、GPU利用率和准确性等,并将对图形处理器的利用率较高的目标算子接入所述目标服务器集群,相应地,若所述目标算子对图形处理器的利用率小于或等于所述第三预设值,这可以拒绝将该目标算子接入目标服务器集群。这样,后续目标算子处理所述目标作业的作业任务时,可以提高对图形处理器的利用率。
具体地,本实施例中,对目标算子进行压测,可以获取目标算子在提供计算服务时真实占用的资源、单实例所能承载的每秒查询率(Queries-per-second,QPS)以及时延情况,以便于为后续部署提供依据。同时,对目标算子进行压测,也可以测试出算子对GPU卡的极限利用率,如果极限利用率太低,则证明该算子没有充分使用GPU计算资源,不适合接入。
该实施方式中,在将目标算子接入目标服务器集群之前,通过对目标算子进行压测,并将对图形处理器的利用率较高的目标算子接入目标服务器集群,这样,可以进一步提高对图形处理器的利用率,同时,可以为后续部署提供依据。
应当说明的是,本公开上述实施例提供的作业处理方法可以在GPU上实现。
请参见图2,为本公开实施例提供的一种作业处理系统的模块图,其中,所述作业处理系统包括业务端、作业提交系统和目标服务器集群,所述业务端的作业类型包括搜索作业、信息流作业、人工智能(Artificial Intelligence,AI)能力作业和云平台作业,所述作业提交系统包括负载均衡层和网关层,所述目标服务器集群包括特征计算层和资源层。该作业处理系统的作业流程如下:业务端提交的作业任务同一发送至负载均衡层,所述负责均衡层可以将作业任务传递至服务网关,服务网关可以根据地域将作业任务发送至不同的计算模块,例如,上述服务网关可以将接收到的来自A地区的作业任务发送至第一特征计算模块,第一特征计算模块对作业任务进行特征提取之后,将所提取的特征发送至资源层,以便于资源层进行特征计算,得到计算结果,并返回业务端,从而完成作业任务的处理过程。相应地,上述服务网关可以将接收到的来自B地区的作业任务发送至第二特征计算模块,上述服务网关可以将接收到的来自C地区的作业任务发送至第三特征计算模块。
可选地,上述作业提交系统可以提供可视化界面,并向相关人员提供基于作业、算子、业务线等多维度的可视化报表,方便各方人员查看。
上述资源空间可以抽象为具体的资源配额,由作业提交系统的部署模块按需部署。此外,还可以为业务端设置高级别接口,以使业务端可以统一对接服务平台内部生态和K8S云原生生态,这样,可以同时对接服务平台内部系统,并支持私有化部署。在将目标算子部署于目标服务器集群时,可以对目标算子进行ServiceMesh架构改造。改造原则为进行CPU模块和GPU模块的拆分,即把切帧、下载、上传等纯CPU模块从算子服务剥离,形成通用服务部署。原有的算子服务只做GPU预测。该方法能充分利用CPU和GPU,更大限度的提高GPU利用率。
请参见图3,图3是本公开实施例提供的一种作业处理装置300,包括:
检测模块301,用于在接收到目标作业的部署请求的情况下,响应于所述部署请求,检测所述目标作业所需资源空间的大小;
确定模块302,用于基于所述目标作业所需资源空间的大小,在目标服务器集群中确定目标资源空间,其中,所述目标资源空间的大小与所述目标作业所需资源空间的大小相适配;
部署模块303,用于将所述目标作业部署于所述目标服务器集群,以使所述目标服务器集群基于所述目标资源空间处理所述目标作业的作业任务。
可选地,请参见图4,所述作业任务包括在线子任务,所述装置还包括:
预测模块304,用于基于所述目标服务器集群在预设时间段内接收到的在线子任务的数量,预测下一时间节点的在线子任务的数量;
调节模块305,用于基于所述下一时间节点的在线子任务的数量,对所述目标资源空间的大小进行调节。
可选地,所述调节模块305,具体用于在所述下一时间节点的在线子任务的数量小于第一预设值的情况下,减小所述目标资源空间的大小;
所述调节模块305,具体还用于在所述下一时间节点的在线子任务的数量大于第二预设值的情况下,增大所述目标资源空间的大小。
可选地,请参见图4,所述作业任务还包括离线子任务,所述装置还包括:
第一发送模块306,用于在所述下一时间节点的在线子任务的数量小于所述第一预设值的情况下,将所接收到的离线子任务发送至所述目标服务器集群,以使所述目标服务器集群处理所述离线子任务。
可选地,请参见图4,所述目标服务器集群包括至少两个目标服务器,所述装置还包括:
获取模块307,用于在接收所述目标作业的第一作业任务的情况下,获取所述至少两个目标服务器中每个目标服务器的图形处理器利用率;
第二发送模块308,用于将所述第一作业任务发送至所述至少两个目标服务器中的第一目标服务器,其中,所述第一目标服务器为所述至少两个服务器中图形处理器利用率较低的目标服务器。
可选地,请参见图5,所述部署模块303,包括:
获取子模块3031,用于获取目标算子,其中,所述目标算子用于处理所述目标作业的作业任务;
检测子模块3032,用于检测所述目标算子处理所述目标作业的作业任务时,对所述目标服务器集群中的图像处理器的利用率;
接入子模块3033,用于在所述目标算子对所述图形处理器的利用率大于第三预设值的情况下,将所述目标算子接入所述目标服务器集群。
本实施例提供的作业处理装置300能够实现图1所示的方法实施例中的各个过程,且可以达到相同有益效果,为避免重复,这里不再赘述。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本公开的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如作业处理方法。例如,在一些实施例中,作业处理方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的作业处理方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行作业处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (15)

1.一种作业处理方法,包括:
在接收到目标作业的部署请求的情况下,响应于所述部署请求,检测所述目标作业所需资源空间的大小;
基于所述目标作业所需资源空间的大小,在目标服务器集群中确定目标资源空间,其中,所述目标资源空间的大小与所述目标作业所需资源空间的大小相适配;
将所述目标作业部署于所述目标服务器集群,以使所述目标服务器集群基于所述目标资源空间处理所述目标作业的作业任务。
2.根据权利要求1所述的方法,其中,所述作业任务包括在线子任务,所述将所述目标作业部署于所述目标服务器集群之后,所述方法还包括:
基于所述目标服务器集群在预设时间段内接收到的在线子任务的数量,预测下一时间节点的在线子任务的数量;
基于所述下一时间节点的在线子任务的数量,对所述目标资源空间的大小进行调节。
3.根据权利要求2所述的方法,其中,所述基于所述下一时间节点的在线子任务的数量,对所述目标资源空间的大小进行调节,包括:
在所述下一时间节点的在线子任务的数量小于第一预设值的情况下,减小所述目标资源空间的大小;
在所述下一时间节点的在线子任务的数量大于第二预设值的情况下,增大所述目标资源空间的大小。
4.根据权利要求2所述的方法,其中,所述作业任务还包括离线子任务,所述基于所述目标服务器集群在预设时间段内接收到的在线子任务的数量,预测下一时间节点的在线子任务的数量之后,所述方法还包括:
在所述下一时间节点的在线子任务的数量小于所述第一预设值的情况下,将所接收到的离线子任务发送至所述目标服务器集群,以使所述目标服务器集群处理所述离线子任务。
5.根据权利要求1所述的方法,其中,所述目标服务器集群包括至少两个目标服务器,所述将所述目标作业部署于所述目标服务器集群之后,所述方法还包括:
在接收所述目标作业的第一作业任务的情况下,获取所述至少两个目标服务器中每个目标服务器的图形处理器利用率;
将所述第一作业任务发送至所述至少两个目标服务器中的第一目标服务器,其中,所述第一目标服务器为所述至少两个服务器中图形处理器利用率较低的目标服务器。
6.根据权利要求1所述的方法,其中,所述将所述目标作业部署于所述目标服务器集群,包括:
获取目标算子,其中,所述目标算子用于处理所述目标作业的作业任务;
检测所述目标算子处理所述目标作业的作业任务时,对所述目标服务器集群中的图像处理器的利用率;
在所述目标算子对所述图形处理器的利用率大于第三预设值的情况下,将所述目标算子接入所述目标服务器集群。
7.一种作业处理装置,包括:
检测模块,用于在接收到目标作业的部署请求的情况下,响应于所述部署请求,检测所述目标作业所需资源空间的大小;
确定模块,用于基于所述目标作业所需资源空间的大小,在目标服务器集群中确定目标资源空间,其中,所述目标资源空间的大小与所述目标作业所需资源空间的大小相适配;
部署模块,用于将所述目标作业部署于所述目标服务器集群,以使所述目标服务器集群基于所述目标资源空间处理所述目标作业的作业任务。
8.根据权利要求7所述的装置,其中,所述作业任务包括在线子任务,所述装置还包括:
预测模块,用于基于所述目标服务器集群在预设时间段内接收到的在线子任务的数量,预测下一时间节点的在线子任务的数量;
调节模块,用于基于所述下一时间节点的在线子任务的数量,对所述目标资源空间的大小进行调节。
9.根据权利要求8所述的装置,其中,所述调节模块,具体用于在所述下一时间节点的在线子任务的数量小于第一预设值的情况下,减小所述目标资源空间的大小;
所述调节模块,具体还用于在所述下一时间节点的在线子任务的数量大于第二预设值的情况下,增大所述目标资源空间的大小。
10.根据权利要求8所述的装置,其中,所述作业任务还包括离线子任务,所述装置还包括:
第一发送模块,用于在所述下一时间节点的在线子任务的数量小于所述第一预设值的情况下,将所接收到的离线子任务发送至所述目标服务器集群,以使所述目标服务器集群处理所述离线子任务。
11.根据权利要求7所述的装置,其中,所述目标服务器集群包括至少两个目标服务器,所述装置还包括:
获取模块,用于在接收所述目标作业的第一作业任务的情况下,获取所述至少两个目标服务器中每个目标服务器的图形处理器利用率;
第二发送模块,用于将所述第一作业任务发送至所述至少两个目标服务器中的第一目标服务器,其中,所述第一目标服务器为所述至少两个服务器中图形处理器利用率较低的目标服务器。
12.根据权利要求7所述的装置,其中,所述部署模块,包括:
获取子模块,用于获取目标算子,其中,所述目标算子用于处理所述目标作业的作业任务;
检测子模块,用于检测所述目标算子处理所述目标作业的作业任务时,对所述目标服务器集群中的图像处理器的利用率;
接入子模块,用于在所述目标算子对所述图形处理器的利用率大于第三预设值的情况下,将所述目标算子接入所述目标服务器集群。
13.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
14.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的方法。
15.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现权利要求1至6任一项所述的方法。
CN202011509353.6A 2020-12-18 2020-12-18 作业处理方法、装置、电子设备和存储介质 Active CN112506619B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011509353.6A CN112506619B (zh) 2020-12-18 2020-12-18 作业处理方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011509353.6A CN112506619B (zh) 2020-12-18 2020-12-18 作业处理方法、装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN112506619A true CN112506619A (zh) 2021-03-16
CN112506619B CN112506619B (zh) 2023-08-04

Family

ID=74921761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011509353.6A Active CN112506619B (zh) 2020-12-18 2020-12-18 作业处理方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN112506619B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434258A (zh) * 2021-07-07 2021-09-24 京东科技控股股份有限公司 模型部署方法、装置、设备和计算机存储介质
CN114564374A (zh) * 2022-02-21 2022-05-31 北京百度网讯科技有限公司 算子性能评估方法、装置、电子设备及存储介质
CN115086340A (zh) * 2022-06-24 2022-09-20 中国工商银行股份有限公司 服务器资源的配置方法、装置、存储介质及处理器

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104158860A (zh) * 2014-07-31 2014-11-19 国家超级计算深圳中心(深圳云计算中心) 一种作业调度方法及作业调度系统
CN105808347A (zh) * 2014-12-31 2016-07-27 北京神州泰岳软件股份有限公司 集群服务器部署计算方法及装置
CN107343000A (zh) * 2017-07-04 2017-11-10 北京百度网讯科技有限公司 用于处理任务的方法和装置
US20180060106A1 (en) * 2016-08-28 2018-03-01 Vmware, Inc. Multi-tiered-application distribution to resource-provider hosts by an automated resource-exchange system
US20180239646A1 (en) * 2014-12-12 2018-08-23 Nec Corporation Information processing device, information processing system, task processing method, and storage medium for storing program
CN108737270A (zh) * 2018-05-07 2018-11-02 北京京东尚科信息技术有限公司 一种服务器集群的资源管理方法和装置
CN108984301A (zh) * 2018-07-04 2018-12-11 中国人民解放军国防科技大学 自适应云资源调配方法和装置
CN110221909A (zh) * 2019-06-13 2019-09-10 东北大学 一种基于负载预测的Hadoop计算任务推测执行方法
CN110908795A (zh) * 2019-11-04 2020-03-24 深圳先进技术研究院 云计算集群混部作业调度方法、装置、服务器及存储装置
CN111796940A (zh) * 2020-07-06 2020-10-20 中国铁塔股份有限公司 一种资源分配方法、装置和电子设备
CN111860853A (zh) * 2019-05-22 2020-10-30 北京嘀嘀无限科技发展有限公司 在线预测系统、设备、方法及电子设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104158860A (zh) * 2014-07-31 2014-11-19 国家超级计算深圳中心(深圳云计算中心) 一种作业调度方法及作业调度系统
US20180239646A1 (en) * 2014-12-12 2018-08-23 Nec Corporation Information processing device, information processing system, task processing method, and storage medium for storing program
CN105808347A (zh) * 2014-12-31 2016-07-27 北京神州泰岳软件股份有限公司 集群服务器部署计算方法及装置
US20180060106A1 (en) * 2016-08-28 2018-03-01 Vmware, Inc. Multi-tiered-application distribution to resource-provider hosts by an automated resource-exchange system
CN107343000A (zh) * 2017-07-04 2017-11-10 北京百度网讯科技有限公司 用于处理任务的方法和装置
CN108737270A (zh) * 2018-05-07 2018-11-02 北京京东尚科信息技术有限公司 一种服务器集群的资源管理方法和装置
CN108984301A (zh) * 2018-07-04 2018-12-11 中国人民解放军国防科技大学 自适应云资源调配方法和装置
CN111860853A (zh) * 2019-05-22 2020-10-30 北京嘀嘀无限科技发展有限公司 在线预测系统、设备、方法及电子设备
CN110221909A (zh) * 2019-06-13 2019-09-10 东北大学 一种基于负载预测的Hadoop计算任务推测执行方法
CN110908795A (zh) * 2019-11-04 2020-03-24 深圳先进技术研究院 云计算集群混部作业调度方法、装置、服务器及存储装置
CN111796940A (zh) * 2020-07-06 2020-10-20 中国铁塔股份有限公司 一种资源分配方法、装置和电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
何震苇;严丽云;李慧云;张凌;陆钢;: "基于开源PaaS技术的互联网业务平台自动部署方案", 电信科学, no. 10 *
杨杭;张昕;赵建平;: "基于动态反馈的负载均衡方法研究", 长春理工大学学报(自然科学版), no. 06 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434258A (zh) * 2021-07-07 2021-09-24 京东科技控股股份有限公司 模型部署方法、装置、设备和计算机存储介质
CN113434258B (zh) * 2021-07-07 2024-04-12 京东科技控股股份有限公司 模型部署方法、装置、设备和计算机存储介质
CN114564374A (zh) * 2022-02-21 2022-05-31 北京百度网讯科技有限公司 算子性能评估方法、装置、电子设备及存储介质
CN115086340A (zh) * 2022-06-24 2022-09-20 中国工商银行股份有限公司 服务器资源的配置方法、装置、存储介质及处理器

Also Published As

Publication number Publication date
CN112506619B (zh) 2023-08-04

Similar Documents

Publication Publication Date Title
CN108776934B (zh) 分布式数据计算方法、装置、计算机设备及可读存储介质
CN108632365B (zh) 服务资源调整方法、相关装置和设备
CN112506619B (zh) 作业处理方法、装置、电子设备和存储介质
CN114500339B (zh) 一种节点带宽监测方法、装置、电子设备及存储介质
US20160080267A1 (en) Monitoring device, server, monitoring system, monitoring method and program recording medium
CN110766185A (zh) 用户量的确定方法和系统、计算机系统
US20230004419A1 (en) Resource Migration Method and System, and Device
CN114911598A (zh) 任务调度方法、装置、设备以及存储介质
CN114490078A (zh) 一种微服务的动态缩扩容方法、装置及设备
CN115794262A (zh) 任务处理方法、装置、设备、存储介质以及程序产品
CN112615795A (zh) 流量控制方法、装置、电子设备、存储介质及产品
CN114327918B (zh) 调整资源量的方法、装置、电子设备和存储介质
US20180123866A1 (en) Method and apparatus for determining event level of monitoring result
CN111159009A (zh) 一种日志服务系统的压力测试方法及装置
CN116185578A (zh) 计算任务的调度方法和计算任务的执行方法
CN113138772B (zh) 数据处理平台的构建方法、装置、电子设备和存储介质
CN114416357A (zh) 容器组的创建方法、装置、电子设备和介质
CN113055199B (zh) 网关访问方法、装置及网关设备
CN114064403A (zh) 一种任务延迟分析处理方法和装置
CN114168439A (zh) 一种集群内服务的压测控制方法、装置、存储介质及终端
CN113568706A (zh) 针对业务的容器调整方法、装置、电子设备和存储介质
CN113778844A (zh) 一种自动化性能测试方法和装置
CN113760675A (zh) 负载预测方法和装置、电子设备以及计算机可读存储介质
US20140359104A1 (en) Grouping processing method and system
CN113422734B (zh) 资源分发方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant