CN106155807A - 一种实现资源调度的方法与设备 - Google Patents

一种实现资源调度的方法与设备 Download PDF

Info

Publication number
CN106155807A
CN106155807A CN201510177031.9A CN201510177031A CN106155807A CN 106155807 A CN106155807 A CN 106155807A CN 201510177031 A CN201510177031 A CN 201510177031A CN 106155807 A CN106155807 A CN 106155807A
Authority
CN
China
Prior art keywords
equipment
task
execution
information
characteristic information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510177031.9A
Other languages
English (en)
Inventor
游亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510177031.9A priority Critical patent/CN106155807A/zh
Priority to TW104129023A priority patent/TW201636839A/zh
Priority to PCT/US2016/027745 priority patent/WO2016168590A1/en
Priority to US15/130,382 priority patent/US10789100B2/en
Publication of CN106155807A publication Critical patent/CN106155807A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请的目的是提供一种实现资源调度的方法与设备。具体地,获取第一执行设备的组件性能信息;获取第二执行设备上在执行的目标任务的任务特征信息;根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;将所述目标任务调度至所述第三执行设备来执行。与现有技术相比,本申请通过获取第一执行设备的组件性能信息以及第二执行设备上在执行的目标任务的任务特征信息,由两者确定所述第一执行设备中与所述目标任务相匹配的第三执行设备,并将所述目标任务调度至所述第三执行设备来执行,从而有针对性地完成资源和任务的匹配,最大化资源利用率、提升任务运行速度、降低运行功耗。

Description

一种实现资源调度的方法与设备
技术领域
本申请涉及计算机领域,尤其涉及一种实现资源调度的技术。
背景技术
随着大数据时代的来临,云计算、异构网络等可整合更多资源和承载更多数据的技术迅速发展,随之产生了大量资源调度的需求。现有的资源调度技术主要将硬件配置以及运行情况与需要运行任务的需求进行比较,对资源和任务进行匹配,从而完成资源的调度。
然而,现有资源调度技术中用户在资源调度时有一定的盲目性,对任务的需求往往把握不准确,且仅指定静态需求,如任务所需的执行节点数、CPU核心数、内存和存储的大小等,不能针对任务运行的性能特征进行准确匹配,从而造成资源利用不均衡、运行功耗大等问题。
发明内容
本申请的目的是提供一种实现资源调度的方法与设备。
根据本申请的一个方面,提供了一种在调度设备端实现资源调度的方法,其中,该方法包括:
获取第一执行设备的组件性能信息;
获取第二执行设备上在执行的目标任务的任务特征信息;
根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;
将所述目标任务调度至所述第三执行设备来执行。
根据本申请的另一方面,还提供了一种在执行设备端实现资源调度的方法,其中,该方法包括:
测试执行设备上的组件,并将测试所得的所述执行设备的组件性能信息提供至对应的调度设备;
在执行目标任务的过程中,获取所述目标任务的任务特征信息;
将所述任务特征信息提供至所述调度设备。
根据本申请的另一个方面,还提供了一种实现资源调度的调度设备,其中,该调度设备包括:
第一装置,用于获取第一执行设备的组件性能信息;
第三装置,用于获取第二执行设备上在执行的目标任务的任务特征信息;
第五装置,用于根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;
第七装置,用于将所述目标任务调度至所述第三执行设备来执行。
根据本申请的另一方面,还提供了一种实现资源调度的执行设备,其中,该执行设备包括:
第二装置,用于测试执行设备上的组件,并将测试所得的所述执行设备的组件性能信息提供至对应的调度设备;
第四装置,用于在执行目标任务的过程中,获取所述目标任务的任务特征信息;
第六装置,用于将所述任务特征信息提供至所述调度设备。
根据本申请的再一方面,还提供了一种用于实现资源调度的系统,其中,该系统包括如前所述根据本发明一个方面的一种用于实现资源调度的调度设备,以及如前所述根据本发明另一个方面的一种用于实现资源调度的执行设备。
与现有技术相比,本申请通过获取第一执行设备的组件性能信息以及第二执行设备上在执行的目标任务的任务特征信息,由两者确定所述第一执行设备中与所述目标任务相匹配的第三执行设备,并将所述目标任务调度至所述第三执行设备来执行,从而有针对性的完成资源和任务的匹配,最大化资源利用率、减少资源浪费、提升任务运行速度、降低运行功耗。而且,本申请还可以测试执行设备上的组件,以及在执行目标任务的过程中获取所述目标任务的任务特征信息,并将测试所得的所述执行设备的组件性能信息以及所述任务特征信息提供至对应的调度设备,从而更加准确地对任务瓶颈性能需求进行匹配,最大化资源利用率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1示出根据本申请一个方面的一种用于资源调度的调度设备示意图;
图2示出根据本申请一个优选实施例的一种用于资源调度的调度设备示意图;
图3示出根据本申请另一个方面的一种用于资源调度的执行设备示意图;
图4示出根据本申请另一个方面的一种用于实现资源调度的调度设备和执行设备的系统示意图;
图5示出根据本申请一个方面的一种在调度设备端用于实现资源调度的方法流程图;
图6示出根据本申请另一个优选实施例的一种在调度设备端用于实现资源调度的方法流程图;
图7示出根据本申请另一个优选实施例的一种在执行设备端用于实现资源调度的方法流程图;
图8示出根据本申请另一个方面的调度设备和执行设备配合实现一种用于实现资源调度的系统方法流程图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本申请作进一步详细描述。
在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
图1示出根据本申请一个方面的一种用于资源调度的调度设备示1的意图。其中所述调度设备1包括第一装置111、第三装置112、第五装置113和第七装置114。
具体地,调度设备1的第一装置111获取第一执行设备的组件性能信息;第三装置112获取第二执行设备上在执行的目标任务的任务特征信息;第五装置113根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;第七装置114将所述目标任务调度至所述第三执行设备来执行。
在此,本领域技术人员应能理解,所述第一执行设备、所述第二执行设备及所述第三执行设备分别用于指代特定的执行设备,例如,所述第一执行设备包括一个或多个执行设备,所述第二执行设备与所述第三执行设备分别所述第一执行设备的子集;而且,本领域技术人员还应能理解,所述第二执行设备与所述第三执行设备可能相同、不同,或部分相同,例如,当所述第二执行设备仍为所述第一执行设备中最适合执行该目标任务的执行设备时,所述第三执行设备与所述第二执行设备相同,而当所述第一执行设备出现其他执行设备比所述第二执行设备更适合执行该目标任务时,该其他执行设备被调度设备1确定为所述第三执行设备,此时所述第三执行设备与所述第二执行设备是不同的或仅部分相同。
具体地,第一装置111获取第一执行设备的组件性能信息。其中,第一执行设备属于调度设备的所管理的所有可承担任务执行动作的执行节点资源,节点资源由若干硬件和网络资源组合而成,例如,可以是由至少一套CPU、内存、存储、网络等组成的完整的可执行任务的硬件构成的一台或多台物理机或是虚拟机。组件性能信息包括节点资源内硬件和网络的性能,例如,CPU性能、内存宽带、存储系统速率和带宽、网络带宽等。获取所述第一执行设备的组件性能可以是由后台运行框架对所有执行节点在执行任务时进行抓取并存储的性能数据,或是设置相关的执行节点监测模块进行监测而所统计的性能数据,也可以在所有执行节点设置一个在执行节点开机后一直运行的程序对执行节点的性能信息进行定期测试从而获取性能数据,最终这些性能数据可由测试性能的模块或是后台发送至调度设备。获取第一执行节点资源的性能信息,可以更准确地了解可承担任务执行的节点资源的状况,从而对资源调度的准确性和速度提升产生正向影响。
本领域技术人员应能理解上述获取第一执行设备的组件性能信息的方式仅为举例,其他现有的或今后可能出现的获取第一执行设备的组件性能信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第三装置112获取第二执行设备上在执行的目标任务的任务特征信息。其中,第二执行设备是在属于调度设备所管理的所有可承担任务执行动作的执行节点资源中正在执行任务的节点资源。目标任务是由当前由调度设备所管理的执行节点资源上正在运行的任务,其中,目标任务在运行过程中对相应节点资源性能需求是该目标任务的任务特征信息,例如,CPU性能、内存宽带、存储系统速率和带宽、网络带宽等。获取目标任务的性能特征信息可以通过后台运行框架对所有执行节点在执行任务时进行抓取并计算的性能数据,或是设置相关的执行节点监测模块进行监测而所统计的性能数据,也可以在所有执行节点设置一个在任务运行时启动的程序对执行节点的性能信息进行一定频率的性能采样,从而分析一段时间内指定任务的运行特征,最终目标任务的性能特征信息可由第二执行设备或是后台发送给执行设备。获取第二执行设备上在执行的目标任务的任务特征信息可以更准确的了解目标任务对硬件和网络的资源的性能需求,从而对资源调度的准确性和速度提升产生正向影响。
本领域技术人员应能理解上述获取第二执行设备上在执行的目标任务的任务特征信息的方式仅为举例,其他现有的或今后可能出现的获取第二执行设备上在执行的目标任务的任务特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第五装置113根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备。其中,所述第一执行设备组件性能信息可以反映属于调度设备所管理的所有可承担任务执行动作的各执行节点资源的性能特点,而所述任务特征信息可以反映目标任务对资源性能的需求,通过对所述第一执行设备组件性能信息以及任务特征信息进行匹配,可以得出最适合目标任务运行的一个或多个执行设备,选择将任务调度到最适合运行的执行设备中的一个继续进行执行,这个执行设备即为第三执行设备。确定第三执行设备的具体方法可以通过计算任务特征信息相对于所有第一执行设备的组件性能信息的相对分数并根据相对分数排序得出目标任务对执行节点资源需求最高的性能、需求次高的性能等,接着,依据目标任务对执行节点资源需求的排序对第一执行设备进行筛选最终找出第三执行设备。确定所述第一执行设备中与所述目标任务相匹配的第三执行设备,可以进行合理的资源匹配和调度,避免目标任务因为最高性能需求无法满足而导致的任务运行缓慢,同时避免其它性能需求配置多度而造成资源浪费,从而最大化资源利用率。
本领域技术人员应能理解上述确定第三执行设备的方式仅为举例,其他现有的或今后可能出现的确定第三执行设备的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第七装置114将所述目标任务调度至所述第三执行设备来执行。在通过对所述第一执行设备组件性能信息以及任务特征信息进行匹配所确定第三执行设备之后,调度设备可以从第二执行设备将目标任务调度至第三执行设备继续运行,其中,在匹配的过程中最满足任务特征信息的执行设备也可能就是第二执行设备,此时,不需要对目标任务进行调度,使其继续在第二执行设备上运行即可。将所述目标任务调度至所述第三执行设备来执行是通过资源调度使得资源的使用更加合理,从而提高任务的执行速度,最大化资源利用率,降低运行功耗。
优选地,所述与所述目标任务相匹配的第三执行设备满足以下至少任一项:
所述第三执行设备的组件性能信息超过所述任务特征信息;
所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的组件性能信息超过且最接近所述任务特征信息所对应的其他特征信息;
所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的综合性能信息超过且最接近所述任务特征信息所对应的其他综合特征信息。
具体地,所述第三执行设备的组件性能信息超过所述任务特征信息。其中,在调度设备对目标任务和执行设备进行匹配时,根据所获取的第一执行设备中的组件性能信息与所述任务特征信息进行比较,将所有超过所述任务特征信息的第一执行设备筛选出来,例如,将所有各项组件性能的最高值均超过目标任务各项性能特征平均值的第一执行设备筛选出来,从中选择一个执行设备确定为第三执行设备。
进一步地,所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的组件性能信息超过且最接近所述任务特征信息所对应的其他特征信息。因为关键特征信息是反映任务对执行设备各性能需求中要求最高的一个或几个特征信息,因此,可以在将所述目标任务和第一执行设备进行匹配时,以优先满足目标任务关键特征信息为目标,将第三执行设备从第一执行设备中依次筛选出来,例如,各性能特信息所对应的相对比值分数按照分数从高到低依次筛选执行设备,即在所有第一执行设备中首先找满足最高项、然后从结果里找满足次高项并最高项最低、然后从结果里找满足第三高项并次高项最低,依次类推,直到找到各组件性能最适合该任务的执行节点集合为止。接上文举例,假设一个目标任务的键特征信息就是存储系统带宽,其次是内存带宽,CPU需求比较低,网络带宽需求最低,因此调度模块首先从所管理的所有第一执行设备里找到存储系统带宽能满足要求的执行设备,再从该结果的执行设备集合里找到内存带宽满足要求并且存储系统带宽最低的执行设备,再从该结果集里找CPU性能满足要求并且内存带宽最低的执行设备,最后从该结果集里找网络带宽最低满足要求,并且CPU性能最低的执行设备,满足这一条件的所有设备若有若干个则可任意挑选一个作为第三执行设备,调度设备将目标任务调度到第三执行设备上运行,则既能保证存储系统带宽和内存带宽需求得以优先满足,又不浪费高性能的CPU和网络资源,并且能保证该任务得以最快执行,从而提高整体资源利用率、降低运行功耗。
更进一步地,所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的综合性能信息超过且最接近所述任务特征信息所对应的其他综合特征信息。其中,关键特征为影响任务运行速度最明显的一项性能特征,因此,任务可以对关键特征信息进行满足,例如某个任务的CPU和内存带宽为关键特征信息,将所有第一执行设备中最高性能值大于这两项的执行设备筛选出来,接着,将备选的执行设备中剩下的特征信息与与所述任务剩余的特征信息进行比较,将所有超过所述任务剩余特征信息的备选执行设备筛选出来,例如,将所有剩余各项组件性能的最高值均超过目标任务剩余各项性能特征平均值的执行设备筛选出来,计算组件性能最高值与任务剩余特征信息的性能平均值的差值,计算每个执行设备各项差值的平均值并排序,选择其中差值平均值最小的执行设备确定为第三执行设备。
本领域技术人员应能理解上述确定第三执行设备的方式仅为举例,其他现有的或今后可能出现的确定将第三执行设备的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
更优选地,该设备还包括第十五装置(未示出),该第十五装置根据所述任务特征信息,并结合所述第一执行设备的组件性能信息,确定所述任务特征信息所对应的关键特征信息。其中,关键特征信息是反映任务对执行设备各性能需求中要求最高的一个或几个特征信息,例如,目标任务对内存带宽要求很高,如果不能满足该内存带宽需求,则即使在CPU性能很强的情况下,执行速度也会受到阻碍而变慢,在此,内存带宽即为所举例任务的关键特征。确定关键特征信息,可以将任务特征信息和第一执行设备的组件性能进行比较,得出任务特征相对于所有组件性能的相对比值,其中,所述相对比值可以一定程度上反映任务对性能需求的要求。
具体地,通过对所述任务特征信息中各项性能特征进行分析并得出该任务一段时间内的平均性能,例如,某目标任务的各项平均性能为CPU的平均性能CPUtask、内存带宽的平均性能MEMtask、存储系统速率平均性能IOPStask、存储系统带宽平均性能IOtask、网络带宽平均性能NETtask等。同时对第一执行设备的组件性能信息进行排序,即将所述调度设备所管理的所有第一执行设备的组件性能最大值进行排序,得出所有执行设备中各项性能的最高值和最低值,例如,某个调度设备管理五个执行设备,这五个执行设备分别得到的各自组件性能信息中包括CPU最高性能CPUnode(以Gf lops即每秒执行的十亿次浮点数为度量单位)、内存最大带宽MEMnode(以MB/s即每秒百万字节为度量单位)、存储系统的最大速率IOPSnode(以IOPS即每秒输入输出次数为度量单位)和最大带宽IOnode(以MB/s为度量单位)、网络最大带宽NETnode(以MB/s为度量单位)等,接着对五个执行设备的各项性能信息进行排序得到所有执行设备里CPU性能最低值和最高值CPUmin、CPUmax,内存带宽的最低值和最高值MEMmin、MEMmax,存储系统访问速率的最低值和最高值IOPSmin、IOPSmax,存储系统带宽的最低值和最高值IOmin、IOmax,以及网络带宽的最低值和最高值NETmin、NETmax等。最后,计算该任务的性能相对于所有执行设备各组件性能的相对比值分数,例如,CPU的分数CPUscore=(CPUtask–CPUmin)/(CPUmax-CPUmin),内存带宽的分数MEMscore=(MEMtask–MEMmin)/(MEMmax-MEMmin),存储系统速率的分数IOPSscore=(IOPStask–IOPSmin)/(IOPSmax-IOPSmin),存储系统带宽的分数IOscore=(IOtask–IOmin)/(IOmax-IOmin),网络带宽的分数NETscore=(NETtask–NETmin)/(NETmax-NETmin)等,所得这些相对比值中可以设置一个阈值,例如,设置阈值为0.5,则大于0.5的所述相对比值分数所对应的特征信息即为该任务的关键特征信息。确定所述所述任务特征信息所对应的关键特征信息可以准确把握任务对执行设备组件性能最迫切的需求,使得在资源调度更加合理和准确。
本领域技术人员应能理解上述确定关键特征信息的方式仅为举例,其他现有的或今后可能出现的确定关键特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,调度设备1还包括第十七装置(未示出)和第十九装置(未示出),该第十七装置获取用户查询请求;该第十九装置将所述用户查询请求所对应的请求响应信息提供至对应用户。其中,所述用户查询请求是用户为掌握调度设备所管理的执行设备状况或者需要了解正在执行的目标任务的状况对调度设备发出的消息,接受到查询请求后,调度设备对所管理的任务和执行设备进行监控数据的提取并对用户进行相应的响应。
进一步地,所述请求响应信息包括以下至少任一项:所述对应用户的对应任务的任务调度信息;所述对应用户的对应任务的任务运行状态信息;所述用户查询请求的对应执行设备的设备运行状态信息。具体地,所述对应用户的对应任务是指所述对应任务的执行请求是由该用户提交至所述调度设备,因此,用户可以对名下所有提交过的任务进行查询,其中,包括所述任务调度信息,即该任务曾经、正在以及即将执行的设备与所述任务的对应关系都包括在所述任务调度信息中,同时用户查询可响应的信息包括任务当前和历史运行状态以及对应的执行设备运行的状态。
图2示出根据本申请一个优选实施例的一种用于资源调度的调度设备1的示意图。其中,所述调度设备1包括包括第一装置211、第三装置212、第五装置213、第七装置214、第九装置215、第十一装置216和第十三装置217。
具体地,调度设备1的第一装置211获取第一执行设备的组件性能信息;第九装置215获取关于目标任务的任务调度请求;第十一装置216根据所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相对应的第二执行设备;第三装置212获取第二执行设备上在执行的目标任务的任务特征信息;第五装置213根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;第七装置214将所述目标任务调度至所述第三执行设备来执行;第十三装置217将所述目标任务调度至所述第二执行设备来执行。
调度设备1的第一装置、第三装置、第五装置和第七装置与图1中的相同或相似,在此不再赘述。
具体地,第九装置215获取关于目标任务的任务调度请求。其中关于目标任务的调度请求是由用户发出的或是别的调度设备所转至当前调度设备中的,且尚未在所述调度设备所管理的执行节点资源中开始执行的,请求目标任务调度到当前调度设备所管理的执行节点资源中执行的消息,以上关于目标任务调度请求的状况包括但不限于此,即所有有关目标任务需要在所述调度设备所管理的执行节点进行执行的请求都可包含于此。
接着,第十一装置216根据所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相对应的第二执行设备。其中,所述第一执行设备的组件性能由第一装置211获取。第二执行设备是指在接受到所述目标任务调度请求后,为对任务进行特征信息分析以及避免任务长时间被搁置等待,而综合分析第一执行设备的组件信息并选择出的当前最适合任务运行的执行设备。为了节省时间,且避免任务因为执行节点资源的硬件性能所限而导致在第二设备执行时所获取的任务特征信息有误,对第一执行设备的组件性能信息进行综合排序,可选择目前处于空闲状态且综合性能最好的设备作为第二执行设备,例如,所述第二执行设备的各个组件性能均超过当前空闲状态的执行设备的各个组件平均性能的百分之十到百分之三十。确定所述第一执行设备中与所述目标任务相对应的的第二执行设备,可以让任务以最快的速度投入运行,避免的等待和任务的拥堵,同时在第二执行设备上可以对任务的特征性能信息进行获取,帮助确定第三执行设备,从而提高了任务的运行速度,对最大化资源利用率,降低功耗产生了正向影响。
本领域技术人员应能理解上述确定第二执行设备的方式仅为举例,其他现有的或今后可能出现的确定第二执行设备的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第十三装置217将所述目标任务调度至所述第二执行设备来执行。在通过对所述第一执行设备的组件性能信息进行综合分析后得出当前可以让任务最快运行且最大程度不受硬件资源约束的第二设备,调度设备可以将目标任务调度到所述第二设备进行运行,从而减少目标任务等待时间,同时获取目标任务的特征信息。
图3示出根据本申请另一个方面的一种用于资源调度的执行设备2的示意图。其中,所述执行设备2包括第二装置321、第四装置322和第六装置323。
具体地,所述执行设备2的第二装置321测试执行设备上的组件,并将测试所得的所述执行设备的组件性能信息提供至对应的调度设备;第四装置322在执行目标任务的过程中,获取所述目标任务的任务特征信息;第六装置323将所述任务特征信息提供至所述调度设备。
执行设备2的第二装置321测试执行设备上的组件,并将测试所得的所述执行设备的组件性能信息提供至对应的调度设备。其中,执行设备为由调度设备所管理的若干执行节点资源中的一个,所述需要测试的执行设备上的组件是指每个执行设备中若干硬件和网络资源,例如,可以是至少一套CPU、内存、存储、网络等组成的完整的可执行任务的硬件集合。组件性能信息包括执行设备的硬件和网络性能,例如,CPU性能、内存宽带、存储系统速率和带宽、网络带宽等。测试的方法可以是在每个执行设备上设置一个开机即运行的程序,定期对执行设备上组件进行运行测试,优选地,所测性能信息中可以包括所述执行设备上组件的最大值和最小值,例如,CPU最高性能CPUnode(以Gf lops即每秒执行的十亿次浮点数为度量单位)、内存最大带宽MEMnode(以MB/s即每秒百万字节为度量单位)、存储系统的最大速率IOPSnode(以IOPS即每秒输入输出次数为度量单位)和最大带宽IOnode(以MB/s为度量单位)、网络最大带宽NETnode(以MB/s为度量单位)等。测试所得执行设备组件性能可以由各执行设备发送给调度设备,从而在进行资源调度时对各执行设备的情况把握更清晰和准备,对合理进行资源度产生正向影响。
接着,第四装置322在执行目标任务的过程中,获取所述目标任务的任务特征信息。其中,所述目标任务是在所述执行设备中执行的任务。所述任务信息包括所述目标任务所运行的执行设备上的各硬件及网络等组件的性能信息,例如,CPU性能、内存宽带、存储系统速率和带宽、网络带宽等。获取目标任务的性能特征信息可以通过后台运行框架对所有执行节点在执行任务时进行抓取并计算的性能数据,或是设置相关的执行节点监测模块进行监测而所统计的性能数据,也可以在所有执行节点设置一个在任务运行时启动的程序对执行节点的性能信息进行一定频率的性能采样,从而分析一段时间内指定任务的运行特征,最终目标任务的性能特征信息可由执行设备发送给执行设备。获取执行设备上在执行的目标任务的任务特征信息可以更准确的了解目标任务对硬件和网络的资源的性能需求,从而对资源调度的准确性和速度提升产生正向影响。
本领域技术人员应能理解上述获取目标任务的任务特征信息的方式仅为举例,其他现有的或今后可能出现的获取目标任务的任务特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,第六装置323将所述任务特征信息提供至所述调度设备。其中,调度设备是指所述目标任务所在执行设备所归属的调度设备,提供至所述调度设备的方法可以通过调度设备与执行设备所在系统进行传输。所述任务特征信息反映了目标任务对各性能相关的组件资源的需求,将获取所述目标任务的特征信息提供至所述调度设备会使得调度设备在进行资源调度时可充分参任务的特征对符合条件的资源进行合理匹配,使得所调度的供目标任务运行的执行设备即可满足任务需求又不会因为过度配置而造成执行设备资源的浪费。
进一步地,所述执行设备2还包括第八装置(未示出),该第八装置执行由所述调度设备调度至所述执行设备的目标任务。其中,所述调度设备调度至所述执行设备的目标任务,包括执行目标任务首次在所述调度设备所管理的执行设备中执行并进行目标任务的特征信息分析,以及执行经过对所述目标任务特征信息进行分析和与所有调度设备所管理的执行设备性能信息进行匹配后对目标任务进行执行,进一步地,目标任务首次所执行所在的执行设备以及性能信息匹配后执行所在的执行设备,可以是不同的两个执行设备,也可以是同一个执行设备,因为,目标任务首次执行所在的执行设备在匹配是也在备选的执行设备范围内,是有一定几率成为最适合任务运行的执行设备的,此时,任务不需要进行二次调度。
优选地,该设备还包括第十装置(未示出),该第十装置根据所述任务特征信息,并结合所述第一执行设备的组件性能信息,确定所述任务特征信息所对应的关键特征信息,其中,所述第六装置用于:将所述任务特征信息提供至所述调度设备,其中,所述任务特征信息包括所述关键特征信息。
其中,所述第一执行设备的组件性能信息由各执行设备采集并发送至调度设备后,调度设备会将所管理的所有执行设备及其所对应的组件性能信息发送至所有执行设备中,因此每个执行设备中,均有所有其它执行设备的组件性能信息,即所述第一执行设备的组件信息。关键特征信息是反映任务对执行设备各性能需求中要求最高的一个或几个特征信息,例如,目标任务对内存带宽要求很高,如果不能满足该内存带宽需求,则即使在CPU性能很强的情况下,执行速度也会受到阻碍而变慢,在此,内存带宽即为所举例任务的关键特征。确定关键特征信息,可以将任务特征信息和第一执行设备的组件性能进行比较,得出任务特征相对于所有组件性能的相对比值,其中,所述相对比值可以一定程度上反映任务对性能需求的要求。
具体地,通过对所述任务特征信息中各项性能特征进行分析并得出该任务一段时间内的平均性能,例如,某目标任务的各项平均性能为CPU的平均性能CPUtask、内存带宽的平均性能MEMtask、存储系统速率平均性能IOPStask、存储系统带宽平均性能IOtask、网络带宽平均性能NETtask等。同时对第一执行设备的组件性能信息进行排序,即将所述调度设备所管理的所有第一执行设备的组件性能最大值进行排序,得出所有执行设备中各项性能的最高值和最低值,例如,某个调度设备管理五个执行设备,这五个执行设备分别得到的各自组件性能信息中包括CPU最高性能CPUnode(以Gf lops即每秒执行的十亿次浮点数为度量单位)、内存最大带宽MEMnode(以MB/s即每秒百万字节为度量单位)、存储系统的最大速率IOPSnode(以IOPS即每秒输入输出次数为度量单位)和最大带宽IOnode(以MB/s为度量单位)、网络最大带宽NETnode(以MB/s为度量单位)等,接着对五个执行设备的各项性能信息进行排序得到所有执行设备里CPU性能最低值和最高值CPUmin、CPUmax,内存带宽的最低值和最高值MEMmin、MEMmax,存储系统访问速率的最低值和最高值IOPSmin、IOPSmax,存储系统带宽的最低值和最高值IOmin、IOmax,以及网络带宽的最低值和最高值NETmin、NETmax等。最后,计算该任务的性能相对于所有执行设备各组件性能的相对比值分数,例如,CPU的分数CPUscore=(CPUtask–CPUmin)/(CPUmax-CPUmin),内存带宽的分数MEMscore=(MEMtask–MEMmin)/(MEMmax-MEMmin),存储系统速率的分数IOPSscore=(IOPStask–IOPSmin)/(IOPSmax-IOPSmin),存储系统带宽的分数IOscore=(IOtask–IOmin)/(IOmax-IOmin),网络带宽的分数NETscore=(NETtask–NETmin)/(NETmax-NETmin)等,所得这些相对比值中可以设置一个阈值,例如,设置阈值为0.5,则大于0.5的所述相对比值分数所对应的特征信息即为该任务的关键特征信息。确定所述所述任务特征信息所对应的关键特征信息后,可以由当前任务所在的对关键信息进行确定的执行设备将所述关键特征信息发送给调度设备,从而调度设备可以准确把握任务对执行设备组件性能最迫切的需求,使得在资源调度更加合理和准确。
本领域技术人员应能理解上述确定关键特征信息的方式仅为举例,其他现有的或今后可能出现的确定关键特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,该设备还包括第十二装置(未示出),该第十二装置检测是否满足将所述任务特征信息提供至所述调度设备的触发条件,其中,所述第六装置用于:当满足所述触发条件,将所述任务特征信息提供至所述调度设备。具体地,当目标任务首次在所述调度设备所管理的执行设备上运行并进行特征数据采集时,可能会出现任务程序在采集过程中发生了卡死等故障或是所在的执行设备的硬件出现损坏,从而导致所采集的任务特征信息不准确,因此,有必要设置所述任务特征信息提供至所述调度设备的触发条件,避免上述情况的发送,从而增加系统的可靠性。
进一步地,所述触发条件包括以下至少任一项:所述任务特征信息所对应的采集时间信息超过预定的采集时长阈值;所述目标任务在所述执行设备上执行时间超过预定的执行时长阈值。其中,预定采集时长阈值可以在目标任务所在执行设备硬件故障而导致任务特征信息采集动作停滞时,避免将错误的任务特征信息发送至调度设备,即当采集时长超过所述采集时长阈值时,所述任务特征信息将不会被发送至调度设备。而预定执行时长阈值则可以避免在所述目标任务因自身程序原因卡死而导致任务特征信息采集不准确,即当所述目标任务执行时间超过预定执行时长阈值时,所述任务特征信息也不会被发送至调度设备。上述阈值的设置,可以增加执行设备所提供的任务特征信息的准确性。
图4示出根据本申请另一个方面的一种用于实现资源调度的调度设备和执行设备示的系统示意图。其中,所述系统包括调度设备1和执行设备2。具体地,执行设备2的第二装置测试执行设备上的组件,并将测试所得的所述执行设备的组件性能信息提供至对应的调度设备1;调度设备1的第一装置获取第一执行设备的组件性能信息;执行设备2的第四装置在执行目标任务的过程中,获取所述目标任务的任务特征信息;第六装置将所述任务特征信息提供至所述调度设备1;调度设备1的第三装置获取第二执行设备上在执行的目标任务的任务特征信息;第五装置根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;第七装置将所述目标任务调度至所述第三执行设备来执行。其中,调度设备1的各装置参见图1或图2的相关实施例,执行设备2的各装置参见图3的相关实施例,在此不再赘述。
图5示出根据本申请一个方面的一种在调度设备端用于实现资源调度的方法流程图。
具体地,在步骤S11中调度设备1获取第一执行设备的组件性能信息;在步骤S12中调度设备1获取第二执行设备上在执行的目标任务的任务特征信息;在步骤S13中调度设备1根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;在步骤S14中调度设备1将所述目标任务调度至所述第三执行设备来执行。
在此,本领域技术人员应能理解,所述第一执行设备、所述第二执行设备及所述第三执行设备分别用于指代特定的执行设备,例如,所述第一执行设备包括一个或多个执行设备,所述第二执行设备与所述第三执行设备分别所述第一执行设备的子集;而且,本领域技术人员还应能理解,所述第二执行设备与所述第三执行设备可能相同、不同,或部分相同,例如,当所述第二执行设备仍为所述第一执行设备中最适合执行该目标任务的执行设备时,所述第三执行设备与所述第二执行设备相同,而当所述第一执行设备出现其他执行设备比所述第二执行设备更适合执行该目标任务时,该其他执行设备被调度设备1确定为所述第三执行设备,此时所述第三执行设备与所述第二执行设备是不同的或仅部分相同。
具体地,在步骤S11中调度设备1获取第一执行设备的组件性能信息。其中,第一执行设备属于调度设备的所管理的所有可承担任务执行动作的执行节点资源,节点资源由若干硬件和网络资源组合而成,例如,可以是由至少一套CPU、内存、存储、网络等组成的完整的可执行任务的硬件构成的一台或多台物理机或是虚拟机。组件性能信息包括节点资源内硬件和网络的性能,例如,CPU性能、内存宽带、存储系统速率和带宽、网络带宽等。获取所述第一执行设备的组件性能可以是由后台运行框架对所有执行节点在执行任务时进行抓取并存储的性能数据,或是设置相关的执行节点监测模块进行监测而所统计的性能数据,也可以在所有执行节点设置一个在执行节点开机后一直运行的程序对执行节点的性能信息进行定期测试从而获取性能数据,最终这些性能数据可由测试性能的模块或是后台发送至调度设备。获取第一执行节点资源的性能信息,可以更准确地了解可承担任务执行的节点资源的状况,从而对资源调度的准确性和速度提升产生正向影响。
本领域技术人员应能理解上述获取第一执行设备的组件性能信息的方式仅为举例,其他现有的或今后可能出现的获取第一执行设备的组件性能信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S12中调度设备1获取第二执行设备上在执行的目标任务的任务特征信息。其中,第二执行设备是在属于调度设备所管理的所有可承担任务执行动作的执行节点资源中正在执行任务的节点资源。目标任务是由当前由调度设备所管理的执行节点资源上正在运行的任务,其中,目标任务在运行过程中对相应节点资源性能需求是该目标任务的任务特征信息,例如,CPU性能、内存宽带、存储系统速率和带宽、网络带宽等。获取目标任务的性能特征信息可以通过后台运行框架对所有执行节点在执行任务时进行抓取并计算的性能数据,或是设置相关的执行节点监测模块进行监测而所统计的性能数据,也可以在所有执行节点设置一个在任务运行时启动的程序对执行节点的性能信息进行一定频率的性能采样,从而分析一段时间内指定任务的运行特征,最终目标任务的性能特征信息可由第二执行设备或是后台发送给执行设备。获取第二执行设备上在执行的目标任务的任务特征信息可以更准确的了解目标任务对硬件和网络的资源的性能需求,从而对资源调度的准确性和速度提升产生正向影响。
本领域技术人员应能理解上述获取第二执行设备上在执行的目标任务的任务特征信息的方式仅为举例,其他现有的或今后可能出现的获取第二执行设备上在执行的目标任务的任务特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S13中调度设备1根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备。其中,所述第一执行设备组件性能信息可以反映属于调度设备所管理的所有可承担任务执行动作的各执行节点资源的性能特点,而所述任务特征信息可以反映目标任务对资源性能的需求,通过对所述第一执行设备组件性能信息以及任务特征信息进行匹配,可以得出最适合目标任务运行的一个或多个执行设备,选择将任务调度到最适合运行的执行设备中的一个继续进行执行,这个执行设备即为第三执行设备。确定第三执行设备的具体方法可以通过计算任务特征信息相对于所有第一执行设备的组件性能信息的相对分数并根据相对分数排序得出目标任务对执行节点资源需求最高的性能、需求次高的性能等,接着,依据目标任务对执行节点资源需求的排序对第一执行设备进行筛选最终找出第三执行设备。确定所述第一执行设备中与所述目标任务相匹配的第三执行设备,可以进行合理的资源匹配和调度,避免目标任务因为最高性能需求无法满足而导致的任务运行缓慢,同时避免其它性能需求配置多度而造成资源浪费,从而最大化资源利用率。
本领域技术人员应能理解上述确定第三执行设备的方式仅为举例,其他现有的或今后可能出现的确定第三执行设备的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S14中调度设备1将所述目标任务调度至所述第三执行设备来执行。在通过对所述第一执行设备组件性能信息以及任务特征信息进行匹配所确定第三执行设备之后,调度设备可以从第二执行设备将目标任务调度至第三执行设备继续运行,其中,在匹配的过程中最满足任务特征信息的执行设备也可能就是第二执行设备,此时,不需要对目标任务进行调度,使其继续在第二执行设备上运行即可。将所述目标任务调度至所述第三执行设备来执行是通过资源调度使得资源的使用更加合理,从而提高任务的执行速度,最大化资源利用率,降低运行功耗。
优选地,所述与所述目标任务相匹配的第三执行设备满足以下至少任一项:
所述第三执行设备的组件性能信息超过所述任务特征信息;
所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的组件性能信息超过且最接近所述任务特征信息所对应的其他特征信息;
所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的综合性能信息超过且最接近所述任务特征信息所对应的其他综合特征信息。
具体地,所述第三执行设备的组件性能信息超过所述任务特征信息。其中,在调度设备对目标任务和执行设备进行匹配时,根据所获取的第一执行设备中的组件性能信息与所述任务特征信息进行比较,将所有超过所述任务特征信息的第一执行设备筛选出来,例如,将所有各项组件性能的最高值均超过目标任务各项性能特征平均值的第一执行设备筛选出来,从中选择一个执行设备确定为第三执行设备。
进一步地,所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的组件性能信息超过且最接近所述任务特征信息所对应的其他特征信息。因为关键特征信息是反映任务对执行设备各性能需求中要求最高的一个或几个特征信息,因此,可以在将所述目标任务和第一执行设备进行匹配时,以优先满足目标任务关键特征信息为目标,将第三执行设备从第一执行设备中依次筛选出来,例如,各性能特信息所对应的相对比值分数按照分数从高到低依次筛选执行设备,即在所有第一执行设备中首先找满足最高项、然后从结果里找满足次高项并最高项最低、然后从结果里找满足第三高项并次高项最低,依次类推,直到找到各组件性能最适合该任务的执行节点集合为止。接上文举例,假设一个目标任务的键特征信息就是存储系统带宽,其次是内存带宽,CPU需求比较低,网络带宽需求最低,因此调度模块首先从所管理的所有第一执行设备里找到存储系统带宽能满足要求的执行设备,再从该结果的执行设备集合里找到内存带宽满足要求并且存储系统带宽最低的执行设备,再从该结果集里找CPU性能满足要求并且内存带宽最低的执行设备,最后从该结果集里找网络带宽最低满足要求,并且CPU性能最低的执行设备,满足这一条件的所有设备若有若干个则可任意挑选一个作为第三执行设备,调度设备将目标任务调度到第三执行设备上运行,则既能保证存储系统带宽和内存带宽需求得以优先满足,又不浪费高性能的CPU和网络资源,并且能保证该任务得以最快执行,从而提高整体资源利用率、降低运行功耗。
更进一步地,所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的综合性能信息超过且最接近所述任务特征信息所对应的其他综合特征信息。其中,关键特征为影响任务运行速度最明显的一项性能特征,因此,任务可以对关键特征信息进行满足,例如某个任务的CPU和内存带宽为关键特征信息,将所有第一执行设备中最高性能值大于这两项的执行设备筛选出来,接着,将备选的执行设备中剩下的特征信息与与所述任务剩余的特征信息进行比较,将所有超过所述任务剩余特征信息的备选执行设备筛选出来,例如,将所有剩余各项组件性能的最高值均超过目标任务剩余各项性能特征平均值的执行设备筛选出来,计算组件性能最高值与任务剩余特征信息的性能平均值的差值,计算每个执行设备各项差值的平均值并排序,选择其中差值平均值最小的执行设备确定为第三执行设备。
本领域技术人员应能理解上述确定第三执行设备的方式仅为举例,其他现有的或今后可能出现的确定将第三执行设备的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
更优选地,该设备还包括步骤S18(未示出),在步骤S18中调度设备1根据所述任务特征信息,并结合所述第一执行设备的组件性能信息,确定所述任务特征信息所对应的关键特征信息。其中,关键特征信息是反映任务对执行设备各性能需求中要求最高的一个或几个特征信息,例如,目标任务对内存带宽要求很高,如果不能满足该内存带宽需求,则即使在CPU性能很强的情况下,执行速度也会受到阻碍而变慢,在此,内存带宽即为所举例任务的关键特征。确定关键特征信息,可以将任务特征信息和第一执行设备的组件性能进行比较,得出任务特征相对于所有组件性能的相对比值,其中,所述相对比值可以一定程度上反映任务对性能需求的要求。
具体地,通过对所述任务特征信息中各项性能特征进行分析并得出该任务一段时间内的平均性能,例如,某目标任务的各项平均性能为CPU的平均性能CPUtask、内存带宽的平均性能MEMtask、存储系统速率平均性能IOPStask、存储系统带宽平均性能IOtask、网络带宽平均性能NETtask等。同时对第一执行设备的组件性能信息进行排序,即将所述调度设备所管理的所有第一执行设备的组件性能最大值进行排序,得出所有执行设备中各项性能的最高值和最低值,例如,某个调度设备管理五个执行设备,这五个执行设备分别得到的各自组件性能信息中包括CPU最高性能CPUnode(以Gf lops即每秒执行的十亿次浮点数为度量单位)、内存最大带宽MEMnode(以MB/s即每秒百万字节为度量单位)、存储系统的最大速率IOPSnode(以IOPS即每秒输入输出次数为度量单位)和最大带宽IOnode(以MB/s为度量单位)、网络最大带宽NETnode(以MB/s为度量单位)等,接着对五个执行设备的各项性能信息进行排序得到所有执行设备里CPU性能最低值和最高值CPUmin、CPUmax,内存带宽的最低值和最高值MEMmin、MEMmax,存储系统访问速率的最低值和最高值IOPSmin、IOPSmax,存储系统带宽的最低值和最高值IOmin、IOmax,以及网络带宽的最低值和最高值NETmin、NETmax等。最后,计算该任务的性能相对于所有执行设备各组件性能的相对比值分数,例如,CPU的分数CPUscore=(CPUtask–CPUmin)/(CPUmax-CPUmin),内存带宽的分数MEMscore=(MEMtask–MEMmin)/(MEMmax-MEMmin),存储系统速率的分数IOPSscore=(IOPStask–IOPSmin)/(IOPSmax-IOPSmin),存储系统带宽的分数IOscore=(IOtask–IOmin)/(IOmax-IOmin),网络带宽的分数NETscore=(NETtask–NETmin)/(NETmax-NETmin)等,所得这些相对比值中可以设置一个阈值,例如,设置阈值为0.5,则大于0.5的所述相对比值分数所对应的特征信息即为该任务的关键特征信息。确定所述所述任务特征信息所对应的关键特征信息可以准确把握任务对执行设备组件性能最迫切的需求,使得在资源调度更加合理和准确。
本领域技术人员应能理解上述确定关键特征信息的方式仅为举例,其他现有的或今后可能出现的确定关键特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,该方法还包括步骤S19(未示出)和步骤S20(未示出),在步骤S19中调度设备1获取用户查询请求;在步骤S20中调度设备1将所述用户查询请求所对应的请求响应信息提供至对应用户。其中,所述用户查询请求是用户为掌握调度设备所管理的执行设备状况或者需要了解正在执行的目标任务的状况对调度设备发出的消息,接受到查询请求后,调度设备对所管理的任务和执行设备进行监控数据的提取并对用户进行相应的响应。
进一步地,所述请求响应信息包括以下至少任一项:所述对应用户的对应任务的任务调度信息;所述对应用户的对应任务的任务运行状态信息;所述用户查询请求的对应执行设备的设备运行状态信息。具体地,所述对应用户的对应任务是指所述对应任务的执行请求是由该用户提交至所述调度设备,因此,用户可以对名下所有提交过的任务进行查询,其中,包括所述任务调度信息,即该任务曾经、正在以及即将执行的设备与所述任务的对应关系都包括在所述任务调度信息中,同时用户查询可响应的信息包括任务当前和历史运行状态以及对应的执行设备运行的状态。
图6示出根据本申请另一个优选实施例的一种在调度设备端用于实现资源调度的方法流程图。
具体地,在步骤S11中调度设备1获取第一执行设备的组件性能信息;在步骤S15中调度设备1获取关于目标任务的任务调度请求;在步骤S16中调度设备1根据所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相对应的第二执行设备;在步骤S12中调度设备1获取第二执行设备上在执行的目标任务的任务特征信息;在步骤S13中调度设备1根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;在步骤S14中调度设备1将所述目标任务调度至所述第三执行设备来执行;在步骤S17中调度设备1将所述目标任务调度至所述第二执行设备来执行。
其中,步骤S11、S12、S13和S14与图5中的相同或相似,在此不再赘述。
具体地,在步骤S15中调度设备1获取关于目标任务的任务调度请求。其中关于目标任务的调度请求是由用户发出的或是别的调度设备所转至当前调度设备中的,且尚未在所述调度设备所管理的执行节点资源中开始执行的,请求目标任务调度到当前调度设备所管理的执行节点资源中执行的消息,以上关于目标任务调度请求的状况包括但不限于此,即所有有关目标任务需要在所述调度设备所管理的执行节点进行执行的请求都可包含于此。
接着,在步骤S16中调度设备1根据所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相对应的第二执行设备。其中,所述第一执行设备的组件性能在步骤S11中由调度设备1获取。第二执行设备是指在接受到所述目标任务调度请求后,为对任务进行特征信息分析以及避免任务长时间被搁置等待,而综合分析第一执行设备的组件信息并选择出的当前最适合任务运行的执行设备。为了节省时间,且避免任务因为执行节点资源的硬件性能所限而导致在第二设备执行时所获取的任务特征信息有误,对第一执行设备的组件性能信息进行综合排序,可选择目前处于空闲状态且综合性能最好的设备作为第二执行设备,例如,所述第二执行设备的各个组件性能均超过当前空闲状态的执行设备的各个组件平均性能的百分之十到百分之三十。确定所述第一执行设备中与所述目标任务相对应的的第二执行设备,可以让任务以最快的速度投入运行,避免的等待和任务的拥堵,同时在第二执行设备上可以对任务的特征性能信息进行获取,帮助确定第三执行设备,从而提高了任务的运行速度,对最大化资源利用率,降低功耗产生了正向影响。
本领域技术人员应能理解上述确定第二执行设备的方式仅为举例,其他现有的或今后可能出现的确定第二执行设备的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S17中调度设备1将所述目标任务调度至所述第二执行设备来执行。在通过对所述第一执行设备的组件性能信息进行综合分析后得出当前可以让任务最快运行且最大程度不受硬件资源约束的第二设备,调度设备可以将目标任务调度到所述第二设备进行运行,从而减少目标任务等待时间,同时获取目标任务的特征信息。
图7示出根据本申请另一个优选实施例的一种在执行设备端用于实现资源调度的方法流程图。
具体地,在步骤S21中执行设备2测试执行设备上的组件,并将测试所得的所述执行设备的组件性能信息提供至对应的调度设备;在步骤S22中执行设备2在执行目标任务的过程中,获取所述目标任务的任务特征信息;在步骤S23中执行设备2将所述任务特征信息提供至所述调度设备。
在步骤S21中执行设备2测试执行设备上的组件,并将测试所得的所述执行设备的组件性能信息提供至对应的调度设备。其中,执行设备为由调度设备所管理的若干执行节点资源中的一个,所述需要测试的执行设备上的组件是指每个执行设备中若干硬件和网络资源,例如,可以是至少一套CPU、内存、存储、网络等组成的完整的可执行任务的硬件集合。组件性能信息包括执行设备的硬件和网络性能,例如,CPU性能、内存宽带、存储系统速率和带宽、网络带宽等。测试的方法可以是在每个执行设备上设置一个开机即运行的程序,定期对执行设备上组件进行运行测试,优选地,所测性能信息中可以包括所述执行设备上组件的最大值和最小值,例如,CPU最高性能CPUnode(以Gf lops即每秒执行的十亿次浮点数为度量单位)、内存最大带宽MEMnode(以MB/s即每秒百万字节为度量单位)、存储系统的最大速率IOPSnode(以IOPS即每秒输入输出次数为度量单位)和最大带宽IOnode(以MB/s为度量单位)、网络最大带宽NETnode(以MB/s为度量单位)等。测试所得执行设备组件性能可以由各执行设备发送给调度设备,从而在进行资源调度时对各执行设备的情况把握更清晰和准备,对合理进行资源度产生正向影响。
接着,在步骤S22中执行设备2在执行目标任务的过程中,获取所述目标任务的任务特征信息。其中,所述目标任务是在所述执行设备中执行的任务。所述任务信息包括所述目标任务所运行的执行设备上的各硬件及网络等组件的性能信息,例如,CPU性能、内存宽带、存储系统速率和带宽、网络带宽等。获取目标任务的性能特征信息可以通过后台运行框架对所有执行节点在执行任务时进行抓取并计算的性能数据,或是设置相关的执行节点监测模块进行监测而所统计的性能数据,也可以在所有执行节点设置一个在任务运行时启动的程序对执行节点的性能信息进行一定频率的性能采样,从而分析一段时间内指定任务的运行特征,最终目标任务的性能特征信息可由执行设备发送给执行设备。获取执行设备上在执行的目标任务的任务特征信息可以更准确的了解目标任务对硬件和网络的资源的性能需求,从而对资源调度的准确性和速度提升产生正向影响。
本领域技术人员应能理解上述获取目标任务的任务特征信息的方式仅为举例,其他现有的或今后可能出现的获取目标任务的任务特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
接着,在步骤S23中执行设备2将所述任务特征信息提供至所述调度设备。其中,调度设备是指所述目标任务所在执行设备所归属的调度设备,提供至所述调度设备的方法可以通过调度设备与执行设备所在系统进行传输。所述任务特征信息反映了目标任务对各性能相关的组件资源的需求,将获取所述目标任务的特征信息提供至所述调度设备会使得调度设备在进行资源调度时可充分参任务的特征对符合条件的资源进行合理匹配,使得所调度的供目标任务运行的执行设备即可满足任务需求又不会因为过度配置而造成执行设备资源的浪费。
进一步地,所述方法还包括步骤S24(未示出),在步骤S24中执行设备2执行由所述调度设备调度至所述执行设备的目标任务。其中,所述调度设备调度至所述执行设备的目标任务,包括执行目标任务首次在所述调度设备所管理的执行设备中执行并进行目标任务的特征信息分析,以及执行经过对所述目标任务特征信息进行分析和与所有调度设备所管理的执行设备性能信息进行匹配后对目标任务进行执行,进一步地,目标任务首次所执行所在的执行设备以及性能信息匹配后执行所在的执行设备,可以是不同的两个执行设备,也可以是同一个执行设备,因为,目标任务首次执行所在的执行设备在匹配是也在备选的执行设备范围内,是有一定几率成为最适合任务运行的执行设备的,此时,任务不需要进行二次调度。
优选地,该方法还包括步骤S25(未示出),在步骤S25中执行设备2根据所述任务特征信息,并结合所述第一执行设备的组件性能信息,确定所述任务特征信息所对应的关键特征信息,其中,所述步骤S23包括:将所述任务特征信息提供至所述调度设备,其中,所述任务特征信息包括所述关键特征信息。
其中,所述第一执行设备的组件性能信息由各执行设备采集并发送至调度设备后,调度设备会将所管理的所有执行设备及其所对应的组件性能信息发送至所有执行设备中,因此每个执行设备中,均有所有其它执行设备的组件性能信息,即所述第一执行设备的组件信息。关键特征信息是反映任务对执行设备各性能需求中要求最高的一个或几个特征信息,例如,目标任务对内存带宽要求很高,如果不能满足该内存带宽需求,则即使在CPU性能很强的情况下,执行速度也会受到阻碍而变慢,在此,内存带宽即为所举例任务的关键特征。确定关键特征信息,可以将任务特征信息和第一执行设备的组件性能进行比较,得出任务特征相对于所有组件性能的相对比值,其中,所述相对比值可以一定程度上反映任务对性能需求的要求。
具体地,通过对所述任务特征信息中各项性能特征进行分析并得出该任务一段时间内的平均性能,例如,某目标任务的各项平均性能为CPU的平均性能CPUtask、内存带宽的平均性能MEMtask、存储系统速率平均性能IOPStask、存储系统带宽平均性能IOtask、网络带宽平均性能NETtask等。同时对第一执行设备的组件性能信息进行排序,即将所述调度设备所管理的所有第一执行设备的组件性能最大值进行排序,得出所有执行设备中各项性能的最高值和最低值,例如,某个调度设备管理五个执行设备,这五个执行设备分别得到的各自组件性能信息中包括CPU最高性能CPUnode(以Gf lops即每秒执行的十亿次浮点数为度量单位)、内存最大带宽MEMnode(以MB/s即每秒百万字节为度量单位)、存储系统的最大速率IOPSnode(以IOPS即每秒输入输出次数为度量单位)和最大带宽IOnode(以MB/s为度量单位)、网络最大带宽NETnode(以MB/s为度量单位)等,接着对五个执行设备的各项性能信息进行排序得到所有执行设备里CPU性能最低值和最高值CPUmin、CPUmax,内存带宽的最低值和最高值MEMmin、MEMmax,存储系统访问速率的最低值和最高值IOPSmin、IOPSmax,存储系统带宽的最低值和最高值IOmin、IOmax,以及网络带宽的最低值和最高值NETmin、NETmax等。最后,计算该任务的性能相对于所有执行设备各组件性能的相对比值分数,例如,CPU的分数CPUscore=(CPUtask–CPUmin)/(CPUmax-CPUmin),内存带宽的分数MEMscore=(MEMtask–MEMmin)/(MEMmax-MEMmin),存储系统速率的分数IOPSscore=(IOPStask–IOPSmin)/(IOPSmax-IOPSmin),存储系统带宽的分数IOscore=(IOtask–IOmin)/(IOmax-IOmin),网络带宽的分数NETscore=(NETtask–NETmin)/(NETmax-NETmin)等,所得这些相对比值中可以设置一个阈值,例如,设置阈值为0.5,则大于0.5的所述相对比值分数所对应的特征信息即为该任务的关键特征信息。确定所述所述任务特征信息所对应的关键特征信息后,可以由当前任务所在的对关键信息进行确定的执行设备将所述关键特征信息发送给调度设备,从而调度设备可以准确把握任务对执行设备组件性能最迫切的需求,使得在资源调度更加合理和准确。
本领域技术人员应能理解上述确定关键特征信息的方式仅为举例,其他现有的或今后可能出现的确定关键特征信息的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
优选地,该方法还包括步骤S26(未示出),在步骤S26中执行设备2检测是否满足将所述任务特征信息提供至所述调度设备的触发条件,其中,所述步骤S23包括:当满足所述触发条件,将所述任务特征信息提供至所述调度设备。具体地,当目标任务首次在所述调度设备所管理的执行设备上运行并进行特征数据采集时,可能会出现任务程序在采集过程中发生了卡死等故障或是所在的执行设备的硬件出现损坏,从而导致所采集的任务特征信息不准确,因此,有必要设置所述任务特征信息提供至所述调度设备的触发条件,避免上述情况的发送,从而增加系统的可靠性。
进一步地,所述触发条件包括以下至少任一项:所述任务特征信息所对应的采集时间信息超过预定的采集时长阈值;所述目标任务在所述执行设备上执行时间超过预定的执行时长阈值。其中,预定采集时长阈值可以在目标任务所在执行设备硬件故障而导致任务特征信息采集动作停滞时,避免将错误的任务特征信息发送至调度设备,即当采集时长超过所述采集时长阈值时,所述任务特征信息将不会被发送至调度设备。而预定执行时长阈值则可以避免在所述目标任务因自身程序原因卡死而导致任务特征信息采集不准确,即当所述目标任务执行时间超过预定执行时长阈值时,所述任务特征信息也不会被发送至调度设备。上述阈值的设置,可以增加执行设备所提供的任务特征信息的准确性。
图8示出根据本申请另一个方面的调度设备和执行设备配合实现一种用于实现资源调度的系统方法流程图。其中,所述系统包括调度设备1和执行设备2。具体地,执行设备2在步骤S21中测试执行设备上的组件,并将测试所得的所述执行设备的组件性能信息提供至对应的调度设备1;调度设备1在步骤S11中获取第一执行设备的组件性能信息;执行设备2在步骤S22中在执行目标任务的过程中,获取所述目标任务的任务特征信息;在步骤S23中将所述任务特征信息提供至所述调度设备1;调度设备1在步骤S12中获取第二执行设备上在执行的目标任务的任务特征信息;在步骤S13中根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;在步骤S14中将所述目标任务调度至所述第三执行设备来执行。其中,调度设备1的各步骤参见图5或图6的相关实施例,执行设备2的各步骤参见图7的相关实施例,在此不再赘述。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (23)

1.一种在调度设备端的资源调度方法,其中,该方法包括:
获取第一执行设备的组件性能信息;
获取第二执行设备上在执行的目标任务的任务特征信息;
根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;
将所述目标任务调度至所述第三执行设备来执行。
2.根据权利要求1所述的方法,其中,该方法还包括:
获取关于目标任务的任务调度请求;
根据所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相对应的第二执行设备;
将所述目标任务调度至所述第二执行设备来执行。
3.根据权利要求1或2所述的方法,其中,所述与所述目标任务相匹配的第三执行设备满足以下至少任一项:
所述第三执行设备的组件性能信息超过所述任务特征信息;
所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的组件性能信息超过且最接近所述任务特征信息所对应的其他特征信息;
所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的综合性能信息超过且最接近所述任务特征信息所对应的其他综合特征信息。
4.根据权利要求3所述的方法,其中,该方法还包括:
根据所述任务特征信息,并结合所述第一执行设备的组件性能信息,确定所述任务特征信息所对应的关键特征信息。
5.根据权利要求1至4中任一项所述的方法,其中,该方法还包括:
获取用户查询请求;
将所述用户查询请求所对应的请求响应信息提供至对应用户。
6.根据权利要求5所述的方法,其中,所述请求响应信息包括以下至少任一项:
所述对应用户的对应任务的任务调度信息;
所述对应用户的对应任务的任务运行状态信息;
所述用户查询请求的对应执行设备的设备运行状态信息。
7.一种在执行设备端的资源调度方法,包括:
测试执行设备上的组件,并将测试所得的所述执行设备的组件性能信息提供至对应的调度设备;
在执行目标任务的过程中,获取所述目标任务的任务特征信息;
将所述任务特征信息提供至所述调度设备。
8.根据权利要求7所述的方法,其中,该方法还包括:
执行由所述调度设备调度至所述执行设备的目标任务。
9.根据权利要求7或8所述的方法,其中,该方法还包括:
根据所述任务特征信息,并结第一执行设备的组件性能信息,确定所述任务特征信息所对应的关键特征信息;
其中,所述步骤将所述任务特征信息提供至所述调度设备包括:
将所述任务特征信息提供至所述调度设备,其中,所述任务特征信息包括所述关键特征信息。
10.根据权利要求7至9中任一项所述的方法,其中,该方法还包括:
检测是否满足将所述任务特征信息提供至所述调度设备的触发条件;
其中,所述步骤将所述任务特征信息提供至所述调度设备包括:
当满足所述触发条件,将所述任务特征信息提供至所述调度设备。
11.根据权利要求10所述的方法,其中,所述触发条件包括以下至少任一项:
所述任务特征信息所对应的采集时间信息超过预定的采集时长阈值;
所述目标任务在所述执行设备上执行时间超过预定的执行时长阈值。
12.一种实现资源调度的调度设备,其中,该设备包括:
第一装置,用于获取第一执行设备的组件性能信息;
第三装置,用于获取第二执行设备上在执行的目标任务的任务特征信息;
第五装置,用于根据所述任务特征信息及所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相匹配的第三执行设备;
第七装置,用于将所述目标任务调度至所述第三执行设备来执行。
13.根据权利要求12所述的设备,其中,该设备还包括:
第九装置,用于获取关于目标任务的任务调度请求;
第十一装置,用于根据所述第一执行设备的组件性能信息,确定所述第一执行设备中与所述目标任务相对应的第二执行设备;
第十三装置,将所述目标任务调度至所述第二执行设备来执行。
14.根据权利要求12或13所述的设备,其中,所述与所述目标任务相匹配的第三执行设备满足以下至少任一项:
所述第三执行设备的组件性能信息超过所述任务特征信息;
所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的组件性能信息超过且最接近所述任务特征信息所对应的其他特征信息;
所述第三执行设备的对应组件的组件性能信息超过所述任务特征信息所对应的关键特征信息,并且相对其他第一执行设备,所述第三执行设备的其他组件的综合性能信息超过且最接近所述任务特征信息所对应的其他综合特征信息。
15.根据权利要求14所述的设备,其中,该设备还包括:
第十五装置,用于根据所述任务特征信息,并结合所述第一执行设备的组件性能信息,确定所述任务特征信息所对应的关键特征信息。
16.根据权利要求12至15中任一项所述的设备,其中,该设备还包括:
第十七装置,用于获取用户查询请求;
第十九装置,用于将所述用户查询请求所对应的请求响应信息提供至对应用户。
17.根据权利要求16所述的设备,其中,所述请求响应信息包括以下至少任一项:
所述对应用户的对应任务的任务调度信息;
所述对应用户的对应任务的任务运行状态信息;
所述用户查询请求的对应执行设备的设备运行状态信息。
18.一种实现资源调度的执行设备,包括:
第二装置,用于测试执行设备上的组件,并将测试所得的所述执行设备的组件性能信息提供至对应的调度设备;
第四装置,用于在执行目标任务的过程中,获取所述目标任务的任务特征信息;
第六装置,用于将所述任务特征信息提供至所述调度设备。
19.根据权利要求18所述的设备,其中,该设备还包括:
第八装置,用于执行由所述调度设备调度至所述执行设备的目标任务。
20.根据权利要求18或19所述的设备,其中,该设备还包括:
第十装置,用于根据所述任务特征信息,并结合所述第一执行设备的组件性能信息,确定所述任务特征信息所对应的关键特征信息;
其中,所述第六装置用于:
将所述任务特征信息提供至所述调度设备,其中,所述任务特征信息包括所述关键特征信息。
21.根据权利要求18至20中任一项所述的设备,其中,该设备还包括:
第十二装置,用于检测是否满足将所述任务特征信息提供至所述调度设备的触发条件;
其中,所述第六装置用于:
当满足所述触发条件,将所述任务特征信息提供至所述调度设备。
22.根据权利要求21所述的设备,其中,所述触发条件包括以下至少任一项:
所述任务特征信息所对应的采集时间信息超过预定的采集时长阈值;
所述目标任务在所述执行设备上执行时间超过预定的执行时长阈值。
23.一种用于实现资源调用的系统,其中,该系统包括如权利要求12至17中任一项所述的调度设备,以及如权利要求18至22中任一项所述的执行设备。
CN201510177031.9A 2015-04-15 2015-04-15 一种实现资源调度的方法与设备 Pending CN106155807A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201510177031.9A CN106155807A (zh) 2015-04-15 2015-04-15 一种实现资源调度的方法与设备
TW104129023A TW201636839A (zh) 2015-04-15 2015-09-02 一種實現資源調度的方法與設備
PCT/US2016/027745 WO2016168590A1 (en) 2015-04-15 2016-04-15 System, apparatus and method for resource provisioning
US15/130,382 US10789100B2 (en) 2015-04-15 2016-04-15 System, apparatus and method for resource provisioning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510177031.9A CN106155807A (zh) 2015-04-15 2015-04-15 一种实现资源调度的方法与设备

Publications (1)

Publication Number Publication Date
CN106155807A true CN106155807A (zh) 2016-11-23

Family

ID=57126365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510177031.9A Pending CN106155807A (zh) 2015-04-15 2015-04-15 一种实现资源调度的方法与设备

Country Status (4)

Country Link
US (1) US10789100B2 (zh)
CN (1) CN106155807A (zh)
TW (1) TW201636839A (zh)
WO (1) WO2016168590A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109656467A (zh) * 2017-10-11 2019-04-19 阿里巴巴集团控股有限公司 云网络的数据传输系统、数据交互方法、装置及电子设备
CN110119307A (zh) * 2018-02-05 2019-08-13 上海交通大学 数据处理请求的处理方法、装置、存储介质及电子装置
WO2020102929A1 (en) * 2018-11-19 2020-05-28 Alibaba Group Holding Limited Unified power management
CN112131903A (zh) * 2019-06-24 2020-12-25 浙江宇视科技有限公司 设备数据的分析方法、装置、服务平台、系统及介质

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11762684B2 (en) * 2012-01-30 2023-09-19 Workfusion, Inc. Distributed task execution
CN103870317B (zh) * 2012-12-10 2017-07-21 中兴通讯股份有限公司 云计算中的任务调度方法及系统
US10289444B2 (en) * 2015-10-05 2019-05-14 International Business Machines Corporation Client controlled transaction processing involving a plurality of participants
TWI687808B (zh) * 2019-01-25 2020-03-11 睿寬智能科技有限公司 減少寫入效能變化並防止io阻塞的方法
KR20210020570A (ko) * 2019-08-16 2021-02-24 삼성전자주식회사 전자 장치 및 이의 제어 방법
CN110766269A (zh) * 2019-09-02 2020-02-07 平安科技(深圳)有限公司 一种任务分配方法、装置、可读存储介质及终端设备
US11842225B2 (en) * 2019-10-03 2023-12-12 Steering Solutions Ip Holding Corporation Systems and methods for decentralized-distributed processing of vehicle data
US11481259B2 (en) * 2020-01-07 2022-10-25 International Business Machines Corporation Distributing computation workloads based on calculated compute gravity within differing computing paradigms
US11822955B2 (en) * 2020-01-17 2023-11-21 Steering Solutions Ip Holding Corporation System and method for decentralized vehicle software management
US11886224B2 (en) * 2020-06-26 2024-01-30 Advanced Micro Devices, Inc. Core selection based on usage policy and core constraints
US11948010B2 (en) * 2020-10-12 2024-04-02 International Business Machines Corporation Tag-driven scheduling of computing resources for function execution
US10970113B1 (en) 2020-12-23 2021-04-06 CTRL IQ, Inc. Systems and methods for orchestrating seamless, distributed, and stateful high performance computing
US11321064B1 (en) 2021-10-04 2022-05-03 CTRL IQ, Inc. Systems and methods for trusted and secure application deployment via collective signature verification of the application artifacts
US20230229779A1 (en) * 2022-01-18 2023-07-20 Dell Products L.P. Automated ephemeral context-aware device provisioning
CN117149393B (zh) * 2023-09-27 2024-04-02 苏州深捷信息科技有限公司 一种可调试的计算机多任务调度方法和系统

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080086734A1 (en) * 2006-10-10 2008-04-10 Craig Jensen Resource-based scheduler
US20090119301A1 (en) * 2007-11-05 2009-05-07 Ludmila Cherkasova System and method for modeling a session-based system with a transaction-based analytic model
US20110145153A1 (en) * 2009-12-11 2011-06-16 International Business Machines Corporation Negotiating agreements within a cloud computing environment
US20110307903A1 (en) * 2010-06-11 2011-12-15 International Business Machines Corporation Soft partitions and load balancing
US20120284408A1 (en) * 2011-05-04 2012-11-08 International Business Machines Corporation Workload-aware placement in private heterogeneous clouds
US20120317578A1 (en) * 2011-06-09 2012-12-13 Microsoft Corporation Scheduling Execution of Complementary Jobs Based on Resource Usage
US20130339419A1 (en) * 2012-06-18 2013-12-19 Hitachi, Ltd. Method and apparatus to maximize return on investment in hybrid cloud environment
CN104065745A (zh) * 2014-07-07 2014-09-24 电子科技大学 云计算动态资源调度系统和方法
CN104077189A (zh) * 2013-03-29 2014-10-01 西门子公司 一种用于资源分配的方法和装置
CN104317635A (zh) * 2014-10-13 2015-01-28 北京航空航天大学 混合任务下的动态资源调度方法及系统
CN104346221A (zh) * 2013-08-02 2015-02-11 北京百度网讯科技有限公司 服务器硬件设备等级划分、调度管理方法及装置、服务器
CN104407915A (zh) * 2014-12-03 2015-03-11 浪潮集团有限公司 面向分布式虚拟机监视器的节点特征机制
CN104468407A (zh) * 2013-09-16 2015-03-25 中国电信股份有限公司 实现业务平台资源弹性分配的方法与装置
CN104484233A (zh) * 2014-10-31 2015-04-01 北京邮电大学 一种资源分配方法

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53119769A (en) * 1977-03-29 1978-10-19 Fuji Shoji Ltnear substance drawtng method and said tool
US4658351A (en) * 1984-10-09 1987-04-14 Wang Laboratories, Inc. Task control means for a multi-tasking data processing system
US6272481B1 (en) 1996-05-31 2001-08-07 Lucent Technologies Inc. Hospital-based integrated medical computer system for processing medical and patient information using specialized functional modules
US6425005B1 (en) 1997-10-06 2002-07-23 Mci Worldcom, Inc. Method and apparatus for managing local resources at service nodes in an intelligent network
US6363411B1 (en) 1998-08-05 2002-03-26 Mci Worldcom, Inc. Intelligent network
US6779030B1 (en) 1997-10-06 2004-08-17 Worldcom, Inc. Intelligent network
US6804711B1 (en) 1997-10-06 2004-10-12 Mci, Inc. Method and apparatus for managing call processing services in an intelligent telecommunication network
CA2279118A1 (en) 1999-07-29 2001-01-29 Ibm Canada Limited-Ibm Canada Limitee Tooling framework system and method for code generation
US7463890B2 (en) 2002-07-24 2008-12-09 Herz Frederick S M Method and apparatus for establishing ad hoc communications pathways between source and destination nodes in a communications network
US20030153338A1 (en) 2001-07-24 2003-08-14 Herz Frederick S. M. Autoband
EP1859350B1 (en) 2005-03-16 2015-06-24 BRITISH TELECOMMUNICATIONS public limited company Monitoring computer-controlled processes
US7757214B1 (en) * 2005-11-10 2010-07-13 Symantec Operating Coporation Automated concurrency configuration of multi-threaded programs
JP4977375B2 (ja) 2006-02-15 2012-07-18 Necエナジーデバイス株式会社 リチウムイオン電池およびそれを用いた組電池
US8261277B2 (en) 2006-04-10 2012-09-04 General Electric Company System and method for dynamic allocation of resources in a computing grid
US8112527B2 (en) 2006-05-24 2012-02-07 Nec Corporation Virtual machine management apparatus, and virtual machine management method and program
US7613848B2 (en) 2006-06-13 2009-11-03 International Business Machines Corporation Dynamic stabilization for a stream processing system
US7493406B2 (en) 2006-06-13 2009-02-17 International Business Machines Corporation Maximal flow scheduling for a stream processing system
US7792836B2 (en) 2007-06-17 2010-09-07 Global Telegenetics, Inc. Portals and doors for the semantic web and grid
US8281012B2 (en) 2008-01-30 2012-10-02 International Business Machines Corporation Managing parallel data processing jobs in grid environments
US8175863B1 (en) 2008-02-13 2012-05-08 Quest Software, Inc. Systems and methods for analyzing performance of virtual environments
US8935702B2 (en) 2009-09-04 2015-01-13 International Business Machines Corporation Resource optimization for parallel data integration
US9176572B2 (en) 2009-12-16 2015-11-03 Qualcomm Incorporated System and method for controlling central processing unit power with guaranteed transient deadlines
US9081501B2 (en) 2010-01-08 2015-07-14 International Business Machines Corporation Multi-petascale highly efficient parallel supercomputer
US8392930B2 (en) 2010-03-11 2013-03-05 Microsoft Corporation Resource contention log navigation with thread view and resource view pivoting via user selections
US8352658B2 (en) 2010-05-27 2013-01-08 Microsoft Corporation Fabric based lock manager service
US20130024494A1 (en) * 2011-06-13 2013-01-24 Steven Guarrieri Methods and systems for platform optimized design
US9003416B2 (en) 2010-09-29 2015-04-07 International Business Machines Corporation Predicting resource requirements for a computer application
US8676762B2 (en) 2010-12-08 2014-03-18 International Business Machines Corporation Efficient backup and restore of a cluster aware virtual input/output server (VIOS) within a VIOS cluster
US8738972B1 (en) * 2011-02-04 2014-05-27 Dell Software Inc. Systems and methods for real-time monitoring of virtualized environments
JP5421305B2 (ja) * 2011-02-18 2014-02-19 日本電信電話株式会社 割当決定装置、割当決定方法、割当システム及び割当決定プログラム
US8667019B2 (en) 2011-04-01 2014-03-04 Microsoft Corporation Placement goal-based database instance consolidation
US8667020B2 (en) 2011-04-01 2014-03-04 Microsoft Corporation Placement goal-based database instance dynamic consolidation
US8683466B2 (en) 2011-05-24 2014-03-25 Vmware, Inc. System and method for generating a virtual desktop
US8881164B2 (en) 2011-10-18 2014-11-04 Hewlett-Packard Development Company, L.P. Computer process with utilization reduction
CN102866921B (zh) 2012-08-29 2016-05-11 惠州Tcl移动通信有限公司 一种多核cpu的调控方法及系统
US9195506B2 (en) 2012-12-21 2015-11-24 International Business Machines Corporation Processor provisioning by a middleware processing system for a plurality of logical processor partitions
US9432269B2 (en) * 2013-04-06 2016-08-30 Citrix Systems, Inc. Systems and methods for exporting application details using appflow
US9785460B2 (en) 2013-05-03 2017-10-10 Vmware, Inc. Dynamic virtual machine sizing

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080086734A1 (en) * 2006-10-10 2008-04-10 Craig Jensen Resource-based scheduler
US20090119301A1 (en) * 2007-11-05 2009-05-07 Ludmila Cherkasova System and method for modeling a session-based system with a transaction-based analytic model
US20110145153A1 (en) * 2009-12-11 2011-06-16 International Business Machines Corporation Negotiating agreements within a cloud computing environment
US20110307903A1 (en) * 2010-06-11 2011-12-15 International Business Machines Corporation Soft partitions and load balancing
US20120284408A1 (en) * 2011-05-04 2012-11-08 International Business Machines Corporation Workload-aware placement in private heterogeneous clouds
US20120317578A1 (en) * 2011-06-09 2012-12-13 Microsoft Corporation Scheduling Execution of Complementary Jobs Based on Resource Usage
US20130339419A1 (en) * 2012-06-18 2013-12-19 Hitachi, Ltd. Method and apparatus to maximize return on investment in hybrid cloud environment
CN104077189A (zh) * 2013-03-29 2014-10-01 西门子公司 一种用于资源分配的方法和装置
CN104346221A (zh) * 2013-08-02 2015-02-11 北京百度网讯科技有限公司 服务器硬件设备等级划分、调度管理方法及装置、服务器
CN104468407A (zh) * 2013-09-16 2015-03-25 中国电信股份有限公司 实现业务平台资源弹性分配的方法与装置
CN104065745A (zh) * 2014-07-07 2014-09-24 电子科技大学 云计算动态资源调度系统和方法
CN104317635A (zh) * 2014-10-13 2015-01-28 北京航空航天大学 混合任务下的动态资源调度方法及系统
CN104484233A (zh) * 2014-10-31 2015-04-01 北京邮电大学 一种资源分配方法
CN104407915A (zh) * 2014-12-03 2015-03-11 浪潮集团有限公司 面向分布式虚拟机监视器的节点特征机制

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109656467A (zh) * 2017-10-11 2019-04-19 阿里巴巴集团控股有限公司 云网络的数据传输系统、数据交互方法、装置及电子设备
CN109656467B (zh) * 2017-10-11 2021-12-03 阿里巴巴集团控股有限公司 云网络的数据传输系统、数据交互方法、装置及电子设备
CN110119307A (zh) * 2018-02-05 2019-08-13 上海交通大学 数据处理请求的处理方法、装置、存储介质及电子装置
CN110119307B (zh) * 2018-02-05 2022-09-13 上海交通大学 数据处理请求的处理方法、装置、存储介质及电子装置
WO2020102929A1 (en) * 2018-11-19 2020-05-28 Alibaba Group Holding Limited Unified power management
US11644887B2 (en) 2018-11-19 2023-05-09 Alibaba Group Holding Limited Unified power management
CN112131903A (zh) * 2019-06-24 2020-12-25 浙江宇视科技有限公司 设备数据的分析方法、装置、服务平台、系统及介质
CN112131903B (zh) * 2019-06-24 2024-02-20 浙江宇视科技有限公司 设备数据的分析方法、装置、服务平台、系统及介质

Also Published As

Publication number Publication date
WO2016168590A1 (en) 2016-10-20
TW201636839A (zh) 2016-10-16
US10789100B2 (en) 2020-09-29
US20160306673A1 (en) 2016-10-20

Similar Documents

Publication Publication Date Title
CN106155807A (zh) 一种实现资源调度的方法与设备
CN108595157B (zh) 区块链数据的处理方法、装置、设备和存储介质
CN102214139B (zh) 一种面向分布式系统的自动化测试的执行控制与调度方法
CN104123184B (zh) 一种用于为构建过程中的任务分配资源的方法和系统
CN102868573B (zh) Web服务负载云测试方法和装置
CN104461747B (zh) 一种分布式任务调度系统
US9513835B2 (en) Impact-based migration scheduling from a first tier at a source to a second tier at a destination
CN106095673A (zh) 基于web接口的自动化测试方法及系统
CN111125444A (zh) 大数据任务调度管理方法、装置、设备及存储介质
US8365172B2 (en) Horizontal scaling of stream processing
US8869149B2 (en) Concurrency identification for processing of multistage workflows
EP2713270A1 (en) Resource scheduling method and device
CN109634730A (zh) 任务调度方法、装置、计算机设备和存储介质
US20090144743A1 (en) Mailbox Configuration Mechanism
CN109656698A (zh) 任务处理方法、管理平台、执行端及计算机可读存储介质
CN112799782B (zh) 模型生成系统、方法、电子设备及存储介质
CN109614227A (zh) 任务资源调配方法、装置、电子设备及计算机可读介质
CN114153580A (zh) 一种跨多集群的工作调度方法及装置
US20190340004A1 (en) Digital fingerprint analysis
CN113377665A (zh) 基于容器技术的测试方法、装置、电子设备及存储介质
US20140379100A1 (en) Method for requesting control and information processing apparatus for same
CN106062738B (zh) 管理作业状态
CN107423097A (zh) 一种应用程序的管理方法和装置
CN107229569A (zh) 面向多执行技术的自动化测试集中调度执行方法及系统
CN107748720A (zh) 一种检测功能测试案例的业务参数的方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161123